網易首頁 > 網易號 > 正文申請入駐

豆包1.6來了！深度推理測評超DeepSeek-R1，視頻模型超Veo3

2025-06-11 21:07:28　來源: 智東西

北京舉報

分享至

智東西
作者王涵
編輯漠影

智東西6月11日報道，今日，在FORCE原動力大會上，火山引擎推出豆包大模型1.6、豆包·視頻生成模型Seedance 1.0 pro、豆包·語音播客模型，還升級了Agent開發平臺等AI云原生服務。

豆包大模型1.6系列包含三個模型，分別為doubao-seed-1.6、1.6-thinking以及1.6-flash，其中1.6-thinking在推理能力和指令執行測評中超越DeepSeek-R1-0528。

在價格方面，豆包1.6變為按“輸入長度”區間定價，深度思考、多模態能力與基礎語言模型統一價格。在企業使用量最大的0-32K輸入區間，豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens，綜合成本只有豆包1.5深度思考模型或DeepSeek R1的1/3。

豆包·視頻生成模型Seedance 1.0 pro首次在評測榜單Artificial Analysis的文生視頻、圖生視頻兩項任務上均排名首位，超越Veo3、可靈2.0等多模態模型。

并且，Seedance 1.0 pro模型每千tokens僅0.015元，每生成一條5秒的1080P視頻只需3.67元，相當于1萬元預算可以制作2700多條5秒的1080P視頻，被火山引擎稱為“業界最低”。

此外，火山引擎AI云原生全棧服務升級，推出了火山引擎MCP服務、PromptPilot智能提示工具、AI知識管理系統、veRL強化學習框架等面向 Agent 開發和應用的工具產品，并推出多模態數據湖、AICC私密計算、大模型應用防火墻，以及一系列AI Infra套件。

火山引擎最新數據顯示，豆包大模型日均tokens使用量超過16.4萬億，較去年5月首次發布時增長137倍。另據知名行研機構IDC報告，豆包大模型在中國公有云大模型市場份額排名第一，占比高達46.4%。

一、豆包大模型1.6推理測評超DeepSeek-R1，使用成本降至1/3

據悉，豆包大模型1.6系列包含三個模型，分別為doubao-seed-1.6、1.6-thinking以及1.6-flash，并且這三個模型都支持256K上下文。doubao-seed-1.6是All-in-One的綜合模型，深度思考、多模態理解、圖形界面操作等多項能力。用戶可以選擇開啟或關閉深度思考、自適應思考三種方式，其中自適應思考模式可根據提示詞難度自動決定是否開啟思考，提升效果的同時大幅減少tokens消耗。

doubao-seed-1.6-thinking是豆包大模型1.6系列在深度思考方面的強化版本，在代碼、數學、邏輯推理等基礎能力上有進一步提升。doubao-seed-1.6-flash是豆包大模型1.6系列的極速版本，支持深度思考和多模態理解。比較有特點的是，flash的延遲極低，TOPT僅需10毫秒，火山引擎稱其視覺理解能力比肩友商旗艦模型。

智東西從現場了解到，豆包大模型1.6-thinking在推理能力、多模態理解能力、GUI操作能力上較1.5 pro有一定提升，其在GPQA Diamond（推理能力）和Multichallenge（指令執行）榜單上超越DeepSeek-R1-0528，與OpenAI-03-high的差距也在逐步縮小。

1.6系列模型支持多模態理解和圖形界面操作，能夠理解和處理真實世界問題，該能力支持了豆包APP最新的實時視頻通話功能，在企業端可廣泛應用于電商商品審核、自動駕駛標注、安全巡檢等場景。

豆包1.6的圖形界面（GUI）操作能力可以幫助用戶完成一系列“智能體”類的跨平臺操作能力。演示案例顯示，豆包1.6可自動操作瀏覽器完成酒店預定，識別購物小票并整理成Excel表格等任務。

豆包大模型1.6在推理速度、準確度與穩定性上也有明顯提升。豆包大模型1.6具有邊想邊搜、DeepResearch深度研究能力，能獨立思考、規劃、使用搜索等各種研究工具，可以在5-30分鐘內生成一份調研報告。

據悉，目前豆包大模型已涵蓋多模態、視頻、圖像、語音、音樂等模型品類。在行業應用上，豆包大模型已與全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校等達成合作。

為方便企業使用，火山引擎還推出大模型應用實驗室，并開源了手機助手、實時視頻理解、DeepSearch等應用，幫助企業快速搭建AI應用原型，編排專屬智能體。用戶可在火山引擎官網大模型應用實驗室、GitHub方舟開源站點下載使用。

二、Seedance 1.0多視頻生成能力登頂，播客大模型可一句話生成腳本

豆包視頻生成模型Seedance 1.0 pro也在原動力大會上亮相。該模型具備三大特性：無縫多鏡頭敘事、多動作及隨心運鏡、穩定運動與真實美感。Seedance支持文字與圖片輸入，可生成多鏡頭無縫切換的1080P高品質視頻，主體運動穩定性與畫面自然度較高。

在評測榜單Artificial Analysis上，Seedance在文生視頻、圖生視頻兩項任務上均排名首位，超越Veo3、可靈2.0等多模態模型。

原動力大會上還宣布，豆包·實時語音模型全量上線火山方舟，對企業客戶開放使用。該模型支持自然語言高級指令控制，具備唱歌表演、聲線模仿、方言演繹等多種能力，在語氣、用語、思考方式等方面更加擬人。

此外，豆包·語音播客模型也同時發布。用戶輸入對話、網頁鏈接、長文本或文檔，語音播客模型即可生成播客腳本后創作出雙人對話式播客作品。此外，播客模型自帶的深度搜索功能還可以生成跟進熱點話題的播客內容。

二、12款Agent開發工具亮相，數據獲取成本降低80%

火山引擎智能算法負責人吳迪認為，要構建高生產力的Agent，既要用好AI，整合高質量的應用；又要做好AI，關注底層技術本身的優化和創新。為此，此次火山引擎帶來了12款Agent開發工具產品的發布和升級，分別是TRAE、MCP（模型上下文協議）服務、提示詞優化應用PromptPilot、AI知識管理產品以及開源veRL強化學習框架，還有多模態數據湖、AICC私密計算、大模型應用防火墻，以及一系列AI Infra套件。

首先，AI IDE產品TRAE迎來進一步升級，可以為開發者提供代碼補全、局部代碼生成功能，還支持代碼重構、批量修改、知識問答等復雜任務。吳迪在會上透露，TRAE下一個版本還將整合不同Agent和工具，協調任務流程，實現自動串聯操作，逐步從AI輔助編程向支持AI開發全流程進階。據字節跳動技術副總裁洪定坤爆料，在字節內部，超過80%的工程師在使用TRAE輔助開發。自今年1月上線以來，TRAE的整體月活用戶已經超過了100萬。

火山引擎MCP服務正式發布，鏈接Agent開發體系、大模型工具生態、云服務，打通TRAE、火山方舟和扣子，提供200+MCP服務。開發者可以通過MCP，控制火山引擎的云服務組件，完成計算、網絡、存儲等環境部署。

吳迪認為：模型越強，提示詞越重要。提示詞優化應用PromptPilot可以在互動中引導用戶明確需求，自動撰寫和優化提示詞，可以積累案例自動優化提示詞。同時，該應用還具備多輪對話、視覺理解、復雜工具調用的優化能力，還可以自主判斷是否開啟模型精調等。

為解決企業知識管理問題，火山引擎正式發布AI知識管理產品，該款產品支持文本、圖像、音頻、視頻等多模態內容對話式交互，可以結合本地與互聯網知識，提供內容理解和問答服務，推出可交互的推理“做個計劃”功能，實現人機協作制定、修改計劃。該產品目前已在火山引擎全量邀測。

吳迪提到，多步驟復雜任務的成熟和落地是2025年的重要趨勢。最后，火山引擎在會上發布了開源veRL強化學習框架。veRL可擴展多種強化學習算法，無縫集成現有LLM基礎設施與模塊化API，開發者可以借此搭建RL模型開發管線，提升對話規劃、智能編程、復雜策略優化等場景的開發效率與資源利用率。除了提供開源框架，此次火山引擎還上線了veRL平臺，支持強化學習需求。

此外，在數據基礎設施方面，火山引擎推出多模態數據湖解決方案和Data Agent。多模態數據湖是新一代AI Native的數據基建，該解決方案可以幫助企業在多模態數據處理、檢索和分析場景上，識別和利用多模態數據資產，驅動企業AI模型訓練與決策。Data Agent具備數據主動分析、智能洞察、策略生成能力，可將日常取數速度從小時級到分鐘級，數據獲取成本降低80%。該產品的復雜分析效率可以從周級到小時級，洞察及時性提升90%，可以大幅節省深度分析報告、方案等的產出時間和人力成本。

在AI基礎設施方面，火山引擎AI infra推出AgentKit，為企業級Agent打造的全棧開發和服務工具鏈。AgentKit基于火山引擎veFaaS預置模板，集成了豆包大模型1.6與Computer Use等工具，用戶只需選擇模型和配置參數即可快速部署，實現分鐘級10萬核擴容。AgentKit還可以構建完整工具生態體系，支持多終端Tool Use、覆蓋數十類三方MCP Server。

訓練套件TrainingKit則面向后訓練環節，可以實現高達60%+的MFU（算力利用率），通過veRL框架、 Sandbox百萬核秒并發能力，可以有效提升后訓練效率。以及，推理套件ServingKit可以從模型部署、在線推理、服務運維三個階段進行加速和提效，支持開源推理框架，并針對主流模型進行算子優化，性能相比社區最新版本可以提升2-3倍。

安全是一切Agent運行的基礎，針對企業數據和用戶隱私保護，火山引擎還推出兩款AI安全產品。AICC密態計算可以通過用戶個人密鑰加密、CPU/GPU硬件可信環境計算、數據流轉落盤全密文的方式，讓企業在不損失推理效果的前提下，安全合規地使用云端模型。另外，大模型應用防火墻則可以通過精調的小參數模型、分層漏斗策略、流式送檢機制，保障精準攔截攻擊變種，同時不會增加推理延遲。

結語：字節跳動AI全棧路徑明晰

字節跳動在FORCE原動力大會上發布的AI產品矩陣，揭示了其以“模型能力+工具鏈+基礎設施”為核心的產業智能化路徑。從豆包大模型1.6的架構升級到視頻生成、語音交互等全模態能力的突破，再到AI云原生全棧服務的系統化構建，字節跳動的AI戰略已形成從模型研發到應用落地的閉環。

隨著Agent等智能體逐步滲透企業生產流程，字節跳動的AI生態或將進一步推動行業效率提升與創新模式變革，為AI產業發展提供新的范式參考。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.