文小言“更像人”了。
在31日的百度AI Day上,文小言宣布完成品牌煥新與功能升級:品牌視覺上換了套“皮膚”,顯得更加年輕和清新;功能升級上聚焦模型開發與功能創新,支持多模型融合調度,升級全新語音大模型、圖片問答、AI 生圖生視頻等多項能力。
百度對外介紹新文小言時,十分形象的描述:“如果TA聰明、理解能力強、很會找話題,又很年輕,介紹給你,你愿意認識一下嗎?”
文小言再升級
文小言此次升級的核心亮點在于“多模型融合調度”。通過整合百度自研的文心X1、文心4.5等模型,并接入DeepSeek-R1、可靈等第三方優質模型,文小言實現了多模型間的智能協同。
需要補充的是,文心X1發布僅半個月,百度稱其是“首個自主運用工具的深度思考模型”;文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,在多模態交互、理解方面更強,原生模型聯合預訓練能實現更深層次的模態融合。
得益于“自研+開源模型”的組合,用戶擁有了選擇權,切換到“自動模式”,就可一鍵調用最優模型組合,或根據需求靈活選擇單一模型完成特定任務,大幅提升響應速度與任務處理能力。
這也讓文小言擁有了更強的“大腦”。以裝修方案為例,輸出prompt:我的客廳朝向是南偏東,35平米,有一整扇落地窗,請根據我的要求畫出淺色奶油風、暗黑輕奢風、跳脫童趣風這三種不同風格的裝修效果圖,三個戶型必須一致。
我選擇文心X1模式,文小言就能根據需求點,生成多種裝修風格的方案,設計原理、效果圖一應俱全。它在推理過程中,圖文并茂、自如調用工具的能力讓很多人都眼前一亮。
根據百度此前介紹,文心X1利用遞進式強化學習訓練方法、基于思維鏈和行動鏈的端到端訓練、多元統一的獎勵系統等技術。也可以理解為,這是百度自研大模型的獨門絕招,文心X1的推理輸出是直接可以圖文混合連續完成任務。
多模態理解能力上,文小言再度增強圖片理解能力。比如短視頻平臺上有一類比較熱門的挑戰:根據圖片猜測街景或者所在位置。發起者所上傳的圖片,標志性、辨識度以及信息量都不是很高。文小言能夠很快并準確的分析出答案。
還有“中午吃什么”的世界難題,只要你拍下菜單,告訴它類似的需求:兩個人有兩百塊人民幣預算,想要吃得豐富些,應該怎么點餐?文小言在極短的時間內,就能給出一個滿意的解決方案。
文小言還進一步提升了全新語音大模型、圖片問答、AI 生圖生視頻等能力。比如,全新語音大模型支持方言對話、復雜知識問答及隨時打斷等場景,用戶可進行語音知識問答或趣味角色扮演。
以小朋友和小言的對話為例,銜接絲滑,不用擔心打斷后,AI接不上話。還能切換蠟筆小新、孫悟空、熊大熊二等百變音色。不僅如此,其還學會了多種方言。重慶話、河南話、廣西話等等都能聊。
圖片問答功能讓用戶可以通過拍攝或上傳圖片,以文字或語音提問直接獲取深度解析。例如,拍攝一道數學題可實時生成解題思路與視頻解析;上傳多款商品圖可對比參數、價格,輔助購物決策;拍攝杯子設計圖后,AI 可自動解析風格并生成同款手機殼、支架等周邊產品。
值得一提的是,新增的“圖個冷知識”功能更富趣味性,用戶可預設“歷史學者”“科技達人”等人設視角,為同一圖片賦予多維解讀。例如,當用戶詢問“貓窗探秘,為何貓愛窗邊的科學真相?",文小言能從狩獵本能、能量獲取、領地意識等角度給出獨特解讀。
百度找到做AI to C節奏
回溯來看,這應該是文小言兩年來的第二次大規模升級。
2023年3月16日,百度只比OpenAI晚了不到四個月,就推出類ChatGPT生成式AI產品“文心一言”,拉近中國科技公司與海外AI大模型企業的差距。
2024年9月4日,百度把養了一年半的文心一言App升級為“文小言”,其定位也明確為“百度旗下新搜索智能助手”。當時,文小言推出富媒體搜索、多模態輸入、文本與圖片創作、高擬真數字人等“新搜索”能力;同時,獨家首發記憶和自由訂閱等新功能。
這次產品升級和定位折射出百度的野心:延續其在傳統搜索上的優勢,再次定義新搜索。官方認為,區別于其他搜索產品,AI時代的新搜索需要具備AI能力,包括生成式AI、多輪交互、個性化互動、智能體等多元功能。
也就是說,一款合格的“新搜索智能助手”,除了具備傳統的信息檢索能力,還應該滿足用戶在搜、創 、聊等多層次的需求,具備更像人、更懂人的特點。
文小言是百度在AI to C上邁出的關鍵一步,其在搜、創、聊等多個維度實現了對搜索行業的變革。并且,單從名字上看,它的擬人屬性就擺在顯要位置,在傳播上大幅弱化過往百度產品濃重的“工具屬性”,與普通用戶更有“路人緣”。
我還注意到一個業務動向,文小言完成升級后不久的10月,百度召開了2024年第三季度總監會。第三季度通常是百度的戰略季,李彥宏和百度總監級以上管理人員都會參加,可見其重要性。
李彥宏在會上作了近萬字的發言,為百度未來一段時期的業務戰略定調以及作思想動員。其中,他提到,“文小言”沒有必要像豆包、Kimi一樣激進推廣。后續半年,文小言一直“低調發育”,直到此次再度煥新。但其用戶規模、產品體驗友好度,一直居于同類產品相關榜單的前列。
還有比較重要的一點是,基于對搜索的全新認知,李彥宏認為,搜索的重構和重建應該分成兩步:
首先是搜推融合。他強調,搜索做任何的改變,不僅要看對搜索場景下核心業務指標的影響,也要看對Feed這個核心業務指標的影響。空框推薦(比如百度搜索框中會預置一些詞和句子)的本質是一種推薦,因為這個詞不是由用戶來Input的,只有用推薦的理念來做才是正解。
其次,AI要和移動生態結合。AI需要跟移動生態做進一步融合,比如圖像用戶界面和自然語言界面怎么結合會更自然,這會是未來搜索發展的一個范式。
我一直認為,AI to C需要解決兩個關鍵問題:用戶體驗和商業模式。因為只有在這兩方面取得突破,基于不斷優化使用體驗的前提,讓AI解決真實場景的用戶需求,AI to C才能被用戶接受并忠實的留存,進而產生商業價值。
文小言的兩次升級,都沒有偏離李彥宏設定的兩步走策略,也符合這個邏輯。它在不斷融合百度移動生態,比如集成諸多智能體,為用戶提供服務。同時,百度也鼓勵用戶創建自己的智能體,并進行分享。為此,百度還設立社區模塊,打造交流平臺,交流創作經驗。
不僅如此,文小言也在融合百度體系內外的技術能力。在此基礎上,文小言滿足了百度對新搜索的定義。百度也在這個過程中,找到做AI to C產品的節奏:生態層開放,場景層深耕,價值層進行重構。
百度相關負責人在活動現場對唐辰表示,過去 AI App 是模型的展示場,但這對于普通人是不夠的。模型就像引擎,但普通用戶要的是車,就還得加上車架和座椅,才能滿足舒適的駕乘體驗。
在體驗和交流過程中,我明顯感覺到,百度想“開”了之后,其AI To C的產品氣質和節奏,正在發生肉眼可見的變化,有一種甩掉包袱的輕快。就像李彥宏在百度產品接入DeepSeek后表示,“百度希望和大家一起,推動人工智能技術進步,讓所有人都能使用最先進的生產力工具,讓所有人都能從中受益。”
這或許也是百度持續升級文小言的意義。
但不可避免的,百度AI to C產品還存在著一些慣性問題。比如在功能設計上,百度十分慷慨,希望把自己所有的好技術成果都呈現在用戶面前。但面面俱到也并見得是好事,無形中拉高了用戶的使用門檻。我在使用搜題功能中,按照提示尋找上傳問題的入口,花了很長時間。結果在對話框上方,“解題老師”的快捷入口已經被單獨列出來了。
對百度來說,節奏對了,剩下的調試,就是在與時間賽跑,與友商賽跑了。
參考資料:
量子位,《想開后的文小言,真香》
百度,《文小言升級:多模型調度、圖片問答》
智能涌現,《李彥宏內部發言:「文小言」沒必要像豆包、Kimi一樣激進推廣》
36氪頭條轉載:
虎嗅推薦:
36氪首頁推薦、鈦媒體精選:
鈦媒體主編精選:
36氪熱榜、鈦媒體熱榜:
澎湃、界面、36氪、鈦媒體熱榜:
人人都是產品經理主編推薦:
「唐辰同學」
鈦媒體、36氪、老虎財經熱榜
澎湃新聞2024年最澎湃創作者
老虎財經2024年度優秀專欄
河南日報·頂端新聞2024年度影響力作者
界面新聞優質榜單
老虎財經2024年度優秀專欄
騰訊新聞年度優質熱問答主
2023搜狐新聞年度優質創作者
人人都是產品經理2023年度優秀作者
2023網易新聞年度內容合伙人
界面、36氪、鈦媒體、澎湃、藍鯨、老虎財經等平臺專欄認證作者
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.