“老羅,你是在扮演AI吧?”
當數字人羅永浩在直播間淡定回答觀眾,“能喝!我600多個月都能喝,誰還不是個寶寶呢?來,下一個!”時,有用戶發出驚嘆。
這是普通用戶對數字人直播的一次切身感知,幾個數字讓這種感知變得更深刻:近7小時直播,1300萬人觀看,GMV突破5500萬元。
還有一些數字,透露出了這場酷似真人的直播背后的AI能力:AI生成的近10萬字直播詞,互動量超真人直播間3倍,超過8300個AI動作,1.3萬次知識庫調用。
AI大模型的能力正在從各個生活場景中滲透出來。一個多月前,百度發布了最新的文心大模型4.5 Turbo時,以僅為GPT4.5價格的0.2%在行業中走紅;而其在文本理解、文風創作方面的模型能力,則以此次老羅數字人直播的形式,更為直觀地展現出來。
“600多個月的寶寶”、老羅和朱蕭木的雙人配合、讓老羅仰頭時出現“抬頭紋”的指令,全部來自文心4.5T的能力支持。而8300個AI動作背后,則是百度語言、語音、視覺等一系列模型的協同工作。
“應用才是大模型的價值所在”,正如李彥宏此前一直強調的。盡管并未投入通用視頻生成模型,但以應用為錨點、聚焦場景發展模型能力,百度的AI能力正在透過各種應用顯現——在行業還在尋找AI落地模式的當下,赫然實現了“用AI創造GMV”。
四大突破,百度數字人再造一次購物節狂歡
百度羅永浩數字人直播首秀,是今年618期間電商行業少有的新鮮事。
實際上,最終的數據表現,證明這不是一次飄在空中的技術實驗。單場次最終5500萬GMV超出預期,部分3C、食品等核心品類商品帶貨單量超羅永浩5月真人首秀同期數據,創下數字人直播帶貨新紀錄。
今年4月,在百度2025 Create大會上,李彥宏發布了高說服力數字人,將數字人帶入3.0時代,成為一個新的里程碑。新一代高說服力數字人可以像真人一樣,是形神音容高度協調、會思考決策、能協作完成特定任務的超級智能體。
6月17日,在百度AI DAY開放日上,百度副總裁、電商總經理平曉黎介紹,在高說服力數字人的基礎之上,這一次百度電商打造的業界首個超頭主播羅永浩數字人,又一次實現了體驗、內容、視覺、效果的四大突破:
一是上線了業界首個雙數字人互動直播間,提升營銷轉化和C端體驗; 二是基于文心4.5T升級,劇本模式讓數字人“懂創作”“有個性”; 三是實現了業內首個多模態高度融合的數字人,讓數字人超長待機且穩定可控; 四是攻克多任務復雜場景,數字人帶貨效果媲美真人。
直播間用戶看到的是,羅永浩與助播數字人朱蕭木配合自然、頻頻爆梗。他們不但能做出喝奶茶、拎可樂等細節動作,還能與直播間用戶彈幕進行實時互動。
整場直播,AI調用知識庫1.3萬次,生成9.7萬字產品講解內容,雙數字人搭檔做出超8300個動作。
羅永浩數字人:基于文心大模型的最佳實踐
近7小時直播帶貨的背后,起到依托作用的是百度領先的大模型多模態能力。
數字人在長時間里保持一致性和高擬真性的表現力,不是單一的模型就可以解決所有問題,百度數字人的整體方案,以語言模型作為核心驅動,生成劇本,并通過劇本來指導語音和視覺進行多模態的協同以及動態交互。
在6月17日舉辦的AI DAY上,百度集團副總裁吳甜系統性地介紹了多模協同的數字人技術。
百度研制的多模協同的數字人技術,基于文心4.5T,實現了融合多模規劃與深度思考的劇本生成,由劇本驅動數字人多模協同,實現動態決策的實時交互,使數字人的“神、形、音、容、話”達到高度統一。最終,呈現出一個具備高表現力、內容吸引人、“人—物—場”可自由交互的超擬真數字人。
其中相對關鍵的環節,是劇本生成技術,包含了臺詞生成、多模驅動和動態交互三部分。
以羅永浩數字人劇本為例,基于文心大模型4.5 Turbo生成的劇本,展現了主播的個人特色,具備典型的“羅氏幽默”的風格,并能夠實現雙人主播的內容協同,動態實現豐富的實時互動。文本自控的語音合成大模型,可以實現高復原的語音合成能力,再結合直播臺詞及發音人特征,可以合成風格恰當、自然流暢的聲音。
為解決數字人直播雙人聲音配合的難點,百度采用對話上下文編碼器,將對話歷史輸入和當前對話進行語音合成的統一推理計算,最終實現流暢、自然的雙人對話效果。
數字人形象生成以及驅動則通過結合多模態視頻理解、跨模態信號生成、視頻生成等技術,克服了高可控交互,高精度、長時間一致性保持等難點,實現了高一致性超擬真羅永浩數字人長視頻生成。
作為國內最早投入大模型產研的企業之一,百度在芯片、框架、模型、應用四層技術棧布局,AI大模型領域的技術創新優勢明顯。
今年上半年,百度連發4款基座大模型,文心大模型4.5/4.5T、文心大模型X1/X1 Turbo,其中文心4.5價格僅為GPT的1%,X1 Turbo在信通院評測中獲得最高評級。
近日,國際權威市場研究和咨詢機構IDC正式發布《中國基礎大模型產品綜合評估報告,2025》,文心大模型在8項核心評估維度中斬獲7項最高分,成為本次評估中唯一獲得7項滿分的大模型。
吳甜認為,羅永浩數字人是基于文心大模型的最佳實踐。她表示,百度在大模型技術的持續探索和創新,將為用戶帶來更優質的體驗、為行業帶來更具創新力的業務模式。
百度AI應用:不止落地,更攬實績
2025年,大模型賦能千行百業已成為共識。在618的關鍵節點,百度適時推出羅永浩數字人直播間,并實現了追趕直播帶貨行業一線水準的GMV,意味著用戶對于數字人的接受度已經被驗證。
羅永浩作為超頭主播,很大程度上將發揮引領作用,吸引更多超頭主播加入,共建慧播星數字人矩陣,中國直播電商的競爭或將迎來新變局。
百度副總裁、電商總經理平曉黎
作為百度的智能電商平臺,百度優選已經陸續上線搜索智能導購、商品對比、全網比價等新產品能力,目前,每天有超過2000萬用戶在百度使用智能導購進行購買決策。百度提供的數據顯示,使用了數字人直播的商家GMV平均提升62%,降低80%的直播運營成本,真正實現“降本增效雙突破”。
在羅永浩所屬機構交個朋友代表、公司副總裁吳加錄看來,百度的AI能力與交個朋友的直播運營經驗和供應鏈資源實現了技術與場景的完美結合,這類“技術+IP”的協同模式也將為行業探索智能化轉型提供實踐樣本。
與此同時,百度電商還推出兩大計劃:“夢蝶計劃”將通過流量扶持,超頭主播數字人打造、預算扶持,實現百度優選超頭主播的數量倍增;“繁星計劃”則將再次追加10萬個慧播星數字人,投入1億元數字人消費補貼、千萬級別的運營扶持,幫助更多的普通人、中小企業開啟數字人直播。這更進一步凸顯了百度決心在電商領域深耕的決心。
數字人是百度大模型在多模態能力上的綜合體現。數字人聚焦特定垂直領域,相比通用視頻生成模型,具有可以更精準地優化模型、追求極致人機交互體驗、具備實時交互能力、技術門檻相對較低、應用場景清晰、更容易形成可復制商業模式等優勢。
而數字人的成功,其實是百度重投AI應用的一個成果落地案例。百度創始人李彥宏曾在多個場合強調,應用才是大模型真正價值所在。所以,無論在研發文心大模型,還是打造作為AI應用底座的云平臺,百度都是從應用需求出發,讓模型成本更低、云平臺的端到端性能更強。
可以預見的是,大模型的應用能力不止于單獨的APP產品,疊加多模態能力之后,AI還能發揮更大的作用。
今年,百度還上線了無代碼生成工具“秒噠”,讓人人都能開發應用,AI代碼輔助工具“文心快碼”也已經服務了760萬開發者,為百度貢獻了40%以上的新增代碼。在視覺大模型的落地應用上,百度重投無人駕駛,今年蘿卜快跑加速出海,已在全球累計提供服務超1100萬次。
當行業困于通用模型的同質化競爭中,百度早已經快速地將重心轉向了商業場景,以解決各行各業的實際需求為出發點,驅動模型能力的迭代與發展。這種“應用驅動模型”的策略,使AI技術可以率先轉化為可量化的商業價值(GMV),推動了AI行業從技術競賽向解決實際問題、創造真實商業價值方向加速演進。(本文首發于鈦媒體APP,作者|李程程)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.