網易首頁 > 網易號 > 正文申請入駐

成本降低、效率倍增，文小言煥新升級可支持多模型調度

2025-04-01 11:00:01　來源: 來咖

重慶舉報

分享至

3月31日，新一期百度AI DAY上，文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外，文小言聚焦模型開放與功能創新，支持多模型融合調度，升級全新語音大模型、圖片問答、AI生圖生視頻等多項能力，為用戶帶來更智能、更高效的AI體驗。

此次活動上，百度還發布業界首個基于全新互相關注意力(Cross-Attention)的端到端語音語言大模型，實現超低時延與超低成本，在電話語音頻道的語音問答場景中，調用成本較行業均值下降約50%-90%。

百度AI產品創新業務負責人薛蘇強調：“AI的未來不再是單純的技術參數比拼，而是如何通過多模型協同，真正為用戶創造價值。文小言希望通過開放生態，整合頂尖模型能力，做出更強大、更簡單的AI產品。”

據了解，文小言此次升級的核心亮點在于“多模型融合調度”。通過整合百度自研的文心X1、文心4.5等頂尖模型，并接入DeepSeek-R1、可靈等第三方優質模型，文小言實現了多模型間的智能協同。用戶只需選擇“自動模式”，即可一鍵調用最優模型組合，或根據需求靈活選擇單一模型完成特定任務，大幅提升響應速度與任務處理能力。

以“設計三種風格的南偏東客廳效果圖”為例，文小言能夠精準解析裝修風格差異，調用文心X1完成深度推理，生成三幅風格迥異但視角一致的裝修效果圖；隨手拍攝一張茅臺鎮的照片，文小言就可以調用文心4.5的多模態分析能力，精準識別出地理位置、當地產業、建筑風格等詳細信息。

此次功能升級，文小言還進一步提升了全新語音大模型、圖片問答、AI生圖生視頻等能力，全面優化用戶體驗。

比如，全新語音大模型支持方言對話、復雜知識問答及隨時打斷等場景，用戶可進行語音知識問答或趣味角色扮演。接入全新的端到端語音語言大模型后，文小言不僅能支持更擬真的語聊效果，而且支持重慶、廣西、河南、廣東、山東等特色方言。數據顯示，語音大模型具備極低的訓練和使用成本，極快的推理響應速度，語音交互時，可將用戶等待時長從行業常見的3-5秒降低至1秒左右。

文小言還加強了圖片問答功能，用戶拍攝或上傳圖片，以文字或語音提問即可直接獲取深度解析。例如，拍攝一道數學題可實時生成解題思路與視頻解析；上傳多款商品圖可對比參數、價格，輔助購物決策；拍攝杯子設計圖后，AI可自動解析風格并生成同款手機殼、支架等周邊產品。

同時，新增的“圖個冷知識”功能更富趣味性，用戶可預設“歷史學者”“科技達人”等人設視角，為同一圖片賦予多維解讀。例如，當用戶詢問“貓窗探秘，為何貓愛窗邊的科學真相？"，文小言能從狩獵本能、能量獲取、領地意識等角度給出獨特解讀。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.