智東西
作者 王涵
編輯 漠影
智東西6月11日報道,今日,在FORCE原動力大會上,火山引擎推出豆包大模型1.6、豆包·視頻生成模型Seedance 1.0 pro、豆包·語音播客模型,還升級了Agent開發平臺等AI云原生服務。
豆包大模型1.6系列包含三個模型,分別為doubao-seed-1.6、1.6-thinking以及1.6-flash,其中1.6-thinking在推理能力和指令執行測評中超越DeepSeek-R1-0528。
在價格方面,豆包1.6變為按“輸入長度”區間定價,深度思考、多模態能力與基礎語言模型統一價格。在企業使用量最大的0-32K輸入區間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的1/3。
豆包·視頻生成模型Seedance 1.0 pro首次在評測榜單Artificial Analysis的文生視頻、圖生視頻兩項任務上均排名首位,超越Veo3、可靈2.0等多模態模型。
并且,Seedance 1.0 pro模型每千tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,相當于1萬元預算可以制作2700多條5秒的1080P視頻,被火山引擎稱為“業界最低”。
此外,火山引擎AI云原生全棧服務升級,推出了火山引擎MCP服務、PromptPilot智能提示工具、AI知識管理系統、veRL強化學習框架等面向 Agent 開發和應用的工具產品,并推出多模態數據湖、AICC私密計算、大模型應用防火墻,以及一系列AI Infra套件。
火山引擎最新數據顯示,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發布時增長137倍。另據知名行研機構IDC報告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達46.4%。
一、豆包大模型1.6推理測評超DeepSeek-R1,使用成本降至1/3
據悉,豆包大模型1.6系列包含三個模型,分別為doubao-seed-1.6、1.6-thinking以及1.6-flash,并且這三個模型都支持256K上下文。doubao-seed-1.6是All-in-One的綜合模型,深度思考、多模態理解、圖形界面操作等多項能力。用戶可以選擇開啟或關閉深度思考、自適應思考三種方式,其中自適應思考模式可根據提示詞難度自動決定是否開啟思考,提升效果的同時大幅減少tokens消耗。
doubao-seed-1.6-thinking是豆包大模型1.6系列在深度思考方面的強化版本,在代碼、數學、邏輯推理等基礎能力上有進一步提升。doubao-seed-1.6-flash是豆包大模型1.6系列的極速版本,支持深度思考和多模態理解。比較有特點的是,flash的延遲極低,TOPT僅需10毫秒,火山引擎稱其視覺理解能力比肩友商旗艦模型。
智東西從現場了解到,豆包大模型1.6-thinking在推理能力、多模態理解能力、GUI操作能力上較1.5 pro有一定提升,其在GPQA Diamond(推理能力)和Multichallenge(指令執行)榜單上超越DeepSeek-R1-0528,與OpenAI-03-high的差距也在逐步縮小。
1.6系列模型支持多模態理解和圖形界面操作,能夠理解和處理真實世界問題,該能力支持了豆包APP最新的實時視頻通話功能,在企業端可廣泛應用于電商商品審核、自動駕駛標注、安全巡檢等場景。
豆包1.6的圖形界面(GUI)操作能力可以幫助用戶完成一系列“智能體”類的跨平臺操作能力。演示案例顯示,豆包1.6可自動操作瀏覽器完成酒店預定,識別購物小票并整理成Excel表格等任務。
豆包大模型1.6在推理速度、準確度與穩定性上也有明顯提升。豆包大模型1.6具有邊想邊搜、DeepResearch深度研究能力,能獨立思考、規劃、使用搜索等各種研究工具,可以在5-30分鐘內生成一份調研報告。
據悉,目前豆包大模型已涵蓋多模態、視頻、圖像、語音、音樂等模型品類。在行業應用上,豆包大模型已與全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校等達成合作。
為方便企業使用,火山引擎還推出大模型應用實驗室,并開源了手機助手、實時視頻理解、DeepSearch等應用,幫助企業快速搭建AI應用原型,編排專屬智能體。用戶可在火山引擎官網大模型應用實驗室、GitHub方舟開源站點下載使用。
二、Seedance 1.0多視頻生成能力登頂,播客大模型可一句話生成腳本
豆包視頻生成模型Seedance 1.0 pro也在原動力大會上亮相。該模型具備三大特性:無縫多鏡頭敘事、多動作及隨心運鏡、穩定運動與真實美感。Seedance支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質視頻,主體運動穩定性與畫面自然度較高。
在評測榜單Artificial Analysis上,Seedance在文生視頻、圖生視頻兩項任務上均排名首位,超越Veo3、可靈2.0等多模態模型。
原動力大會上還宣布,豆包·實時語音模型全量上線火山方舟,對企業客戶開放使用。該模型支持自然語言高級指令控制,具備唱歌表演、聲線模仿、方言演繹等多種能力,在語氣、用語、思考方式等方面更加擬人。
此外,豆包·語音播客模型也同時發布。用戶輸入對話、網頁鏈接、長文本或文檔,語音播客模型即可生成播客腳本后創作出雙人對話式播客作品。此外,播客模型自帶的深度搜索功能還可以生成跟進熱點話題的播客內容。
二、12款Agent開發工具亮相,數據獲取成本降低80%
火山引擎智能算法負責人吳迪認為,要構建高生產力的Agent,既要用好AI,整合高質量的應用;又要做好AI,關注底層技術本身的優化和創新。為此,此次火山引擎帶來了12款Agent開發工具產品的發布和升級,分別是TRAE、MCP(模型上下文協議)服務、提示詞優化應用PromptPilot、AI知識管理產品以及開源veRL強化學習框架,還有多模態數據湖、AICC私密計算、大模型應用防火墻,以及一系列AI Infra套件。
首先,AI IDE產品TRAE迎來進一步升級,可以為開發者提供代碼補全、局部代碼生成功能,還支持代碼重構、批量修改、知識問答等復雜任務。吳迪在會上透露,TRAE下一個版本還將整合不同Agent和工具,協調任務流程,實現自動串聯操作,逐步從AI輔助編程向支持AI開發全流程進階。據字節跳動技術副總裁洪定坤爆料,在字節內部,超過80%的工程師在使用TRAE輔助開發。自今年1月上線以來,TRAE的整體月活用戶已經超過了100萬。
火山引擎MCP服務正式發布,鏈接Agent開發體系、大模型工具生態、云服務,打通TRAE、 火山方舟和扣子,提供200+MCP服務。開發者可以通過MCP,控制火山引擎的云服務組件,完成計算、網絡、存儲等環境部署。
吳迪認為:模型越強,提示詞越重要。提示詞優化應用PromptPilot可以在互動中引導用戶明確需求,自動撰寫和優化提示詞,可以積累案例自動優化提示詞。同時,該應用還具備多輪對話、視覺理解、復雜工具調用的優化能力,還可以自主判斷是否開啟模型精調等。
為解決企業知識管理問題,火山引擎正式發布AI知識管理產品,該款產品支持文本、圖像、音頻、視頻等多模態內容對話式交互,可以結合本地與互聯網知識,提供內容理解和問答服務,推出可交互的推理“做個計劃”功能,實現人機協作制定、修改計劃。該產品目前已在火山引擎全量邀測。
吳迪提到,多步驟復雜任務的成熟和落地是2025年的重要趨勢。最后,火山引擎在會上發布了開源veRL強化學習框架。veRL可擴展多種強化學習算法,無縫集成現有LLM基礎設施與模塊化API,開發者可以借此搭建RL模型開發管線,提升對話規劃、智能編程、復雜策略優化等場景的開發效率與資源利用率。 除了提供開源框架,此次火山引擎還上線了veRL平臺,支持強化學習需求。
此外,在數據基礎設施方面,火山引擎推出多模態數據湖解決方案和Data Agent。多模態數據湖是新一代AI Native的數據基建,該解決方案可以幫助企業在多模態數據處理、檢索和分析場景上,識別和利用多模態數據資產,驅動企業AI模型訓練與決策。Data Agent具備數據主動分析、智能洞察、策略生成能力,可將日常取數速度從小時級到分鐘級,數據獲取成本降低80%。該產品的復雜分析效率可以從周級到小時級,洞察及時性提升90%,可以大幅節省深度分析報告、方案等的產出時間和人力成本。
在AI基礎設施方面,火山引擎AI infra推出AgentKit,為企業級Agent打造的全棧開發和服務工具鏈。AgentKit基于火山引擎veFaaS預置模板,集成了豆包大模型1.6與Computer Use等工具,用戶只需選擇模型和配置參數即可快速部署,實現分鐘級10萬核擴容。AgentKit還可以構建完整工具生態體系,支持多終端Tool Use、覆蓋數十類三方MCP Server。
訓練套件TrainingKit則面向后訓練環節,可以實現高達60%+的MFU(算力利用率),通過veRL框架、 Sandbox百萬核秒并發能力,可以有效提升后訓練效率。以及,推理套件ServingKit可以從模型部署、在線推理、服務運維三個階段進行加速和提效,支持開源推理框架,并針對主流模型進行算子優化,性能相比社區最新版本可以提升2-3倍。
安全是一切Agent運行的基礎,針對企業數據和用戶隱私保護,火山引擎還推出兩款AI安全產品。AICC密態計算可以通過用戶個人密鑰加密、CPU/GPU硬件可信環境計算、數據流轉落盤全密文的方式,讓企業在不損失推理效果的前提下,安全合規地使用云端模型。另外,大模型應用防火墻則可以通過精調的小參數模型、分層漏斗策略、流式送檢機制,保障精準攔截攻擊變種,同時不會增加推理延遲。
結語:字節跳動AI全棧路徑明晰
字節跳動在FORCE原動力大會上發布的AI產品矩陣,揭示了其以“模型能力+工具鏈+基礎設施”為核心的產業智能化路徑。從豆包大模型1.6的架構升級到視頻生成、語音交互等全模態能力的突破,再到AI云原生全棧服務的系統化構建,字節跳動的AI戰略已形成從模型研發到應用落地的閉環。
隨著Agent等智能體逐步滲透企業生產流程,字節跳動的AI生態或將進一步推動行業效率提升與創新模式變革,為AI產業發展提供新的范式參考。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.