智東西
編譯 金碧輝
編輯 程茜
智東西7月3日消息,據外媒CNBC昨天報道,荷蘭創業者、游戲主播約爾迪·范登布舍(Jordi van den Bussche)最近創建的藍色形象的虛擬主播“Bloo”在YouTube收獲250萬訂閱與7億次觀看,年收入突破百萬美元。
▲虛擬主播Bloo(左)、Bloo的創建者約爾迪·范登布舍(右)(圖源:CNBC)
范登布舍在YouTube主頻道“kwebbelkop”擁有900萬訂閱用戶,范登布舍的團隊通過ElevenLabs、ChatGPT等AI工具實現視頻配音、縮略圖制作等全流程自動化。
虛擬主播“Bloo”通過真人動作捕捉驅動,每日自動生成多語言游戲實況視頻,能替代人類主播完成游戲實況錄制、多語種配音、視頻剪輯全流程。
真人可以通過動作捕捉設備實時驅動虛擬形象的表情與肢體動作,比如直播場景,同時由AI系統自動生成多語言配音、視頻剪輯及頻道運營。
▲虛擬主播Bloo的演示畫面(圖源:CNBC)
同時,西班牙的一家內容工廠,由三個人構成的“金手團隊”(GoldenHand)也在推動AI視頻量產體系:團隊通過全自動化流水線日均生成80條視頻,精準投放65歲以上銀發群體,單頻道月收益超3000美元(折合人民幣約為2.17萬元)。
在2023年,金手團隊推出SaaS工具TubeChef,用戶支付18美元(折合人民幣約為130.14元)/月可自動生成10條AI視頻。
一、虛擬主播技術突破,五分鐘生成個性化視頻
范登布舍在CNBC采訪中透露:“人類是當前模式的缺陷。”當前主流虛擬主播多采用“人控模式”(Puppeteering),真人通過動作捕捉驅動虛擬形象,如Bloo的創作者需實時操控角色表情與語音。
人控模式單視頻制作需4小時,其中包含2小時動捕校準,全AI生成視頻因缺乏即興互動與情感波動,點擊率驟降37%。
但技術正快速進化,專注于AI視頻的創作公司Hedra開發的Character-3系統已實現AI生成5分鐘時長的完整劇情視頻,其最新融資3200萬美元(折合人民幣約為2.31億元)用于研發實時自動化虛擬人。
▲Hedra的產品Character-3允許用戶制作由AI驅動的可實時動畫人物(圖源:CNBC)
AI生成的虛擬網紅虛擬歌手米拉·索菲亞(Milla Sofia)的AI音樂單條視頻在TikTok獲得數十萬點擊量; 喜劇演員喬納森·拉舒沃(Jon Lajoie)的《寶寶脫口秀》是一個超寫實AI嬰兒角色參與的脫口秀節目,通過AI技術生成嬰兒形象并模擬對話,內容幽默荒誕,其中有一個超逼真的動畫嬰兒對著麥克風說話。
▲AI技術生成的逼真的嬰兒對著麥克風說話(圖源:CNBC)
谷歌Veo 3借助V2A技術,將視頻像素轉為語義信號,結合文本生成同步音頻,能精準匹配環境音效、人物對白,實現唇形同步。但因其動用超200億條YouTube視頻訓練模型,已被警告或觸發平臺知識產權危機,面臨創作者集體訴訟風險。
二、西班牙團隊建AI視頻工廠,日產量80條瞄準銀發市場
西班牙“金手團隊”通過全AI視頻流水線實現“去人化生產”,即剝離真人出鏡與手動剪輯環節,以GPT-4生成2000字腳本為起點,經MidJourney自動配圖、ElevenLabs語音合成、AI剪輯工具輸出成片,最終在旗下18個“無面孔頻道”日均發布80條視頻。
在外媒看來,“金手團隊”的商業邏輯在于精準鎖定65歲以上銀發受眾,通過AI批量生成懷舊故事與健康知識等內容單條爆款獲百萬流量,并推出SaaS平臺TubeChef以18美元(折合人民幣約為130元)/月訂閱價向第三方提供同等產能,而團隊人力僅聚焦于每日篩選60-80個創意原型。
有創作者坦言:“構思每日60-80個爆款創意才是真正挑戰,AI反讓我更專注創造力。”
三、AI內容洪水淹沒平臺,用戶怒斥“創意已死”
低質AI內容泛濫正觸發從用戶到技術專家的全鏈條反彈,社交媒體X上“反AI垃圾內容”聲浪高漲,用戶直斥“AI圖像無處不在,毫無創意和意義,令人失望”。
▲網友在X平臺上的發帖(圖源:X平臺)
Meta生成式AI顧問、AI政策顧問亨利·阿杰德(Henry Ajder)在CNBC采訪中透露“數字污染時代已不可避免,即便內容信息量充足且對部分人具有娛樂性或實用性,我們正步入一個無法區分人類創作與AI生成的時代”。
全AI生成內容的技術瓶頸在虛擬主播Bloo的實驗中凸顯,其純AI制作視頻點擊率下降37%,創作者約爾迪·范登布舍向CNBC透露:“當前AI缺乏人類即興互動與情感波動的能力”,僅當技術實現更快、更好、更廉價三重突破時才會完全替代人工操作。
“金手團隊”的實踐進一步印證此矛盾,該團隊通過AI工具鏈日均生產80條視頻主攻老年市場,但未標注的AI生成內容正加劇平臺虛假信息風險。
在外媒看來,技術檢測機制滯后于內容生產規模,從深度偽造檢測機構Vermillio透露的數據來看,YouTube的Content ID系統對AI合成音軌的識別誤報率達34%,而Meta顧問阿杰德警告稱“當平臺失去區分人作與AI的能力時,版權體系與信息真實性將同步崩塌”。
2024年7月,牛津大學在《自然》(Nature)子刊發表的研究成果透露,若持續使用AI生成內容訓練新模型,算法認知偏差率會提升41%。研究團隊通過多輪實驗,發現模型在迭代過程中會逐漸偏離真實數據分布,出現“模型崩潰”現象,生成內容的可信度和多樣性大幅降低。
結語:虛擬主播爆發背后:AI視頻工具的成本收益賬與版權質量坎
虛擬主播的爆發印證了AI視頻工具平民化趨勢:清華系公司生數科技Vidu覆蓋200國用戶,使動畫制作人力成本降至傳統四分之一;谷歌Veo 3以1808元月費降低創作門檻,但技術普及加速內容通脹,導致平臺單視頻廣告收益從千元級縮水至幾十元量級。
隨著用戶使用YouTube內容訓練模型,恐觸發平臺創作者集體訴訟;初創公司Hedra等新技術入場,致低質AI視頻泛濫,虛擬內容生產正引發平臺知識產權與質量管控的雙重危機。
來源:CNBC
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.