出品|網易科技《態度》欄目
作者|丁廣勝
意圖明確,Agent爆發的火候如果卡在「成本高」,豆包1.6要解決它。
剛剛,字節跳動旗下火山引擎發布豆包大模型1.6系列,以及視頻生成模型Seedance 1.0 pro等新模型。
- doubao-seed-1.6:All-in-One 的綜合模型,是國內首個支持256K 上下文的思考模型,支持深度思考、多模態理解、圖形界面操作等多項能力。支持選擇開啟或關閉深度思考、自適應思考三種方式,其中自適應思考模式可根據提示詞難度自動決定是否開啟思考,提升效果的同時大幅減少 tokens 消耗。
- doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的強化版本;在代碼、數學、邏輯推理等基礎能力上進一步提升;支持256K 上下文。
- doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態理解、256K 上下文;延遲極低,TOPT 僅需10ms;視覺理解能力比肩友商旗艦模型。
豆包1.6主要兩大變化,其一是豆包1.6成為國內首款支持256K上下文的推理模型,這使得豆包能夠處理更復雜、更長的文本輸入,從而更好地理解和生成內容。其二是定價策略,其提出“區間定價”方案,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
火山引擎總裁譚待在會后訪談中回應,區間定價是火山引擎的創新,豆包大模型很“誠心”,價格不是為了賺吆喝,豆包一直在做持續性的、正毛利的事情,是通過模型結構、效果、工程等的優化,使得價格進一步降低,從而去解決Agent產業的問題——定價策略也參考了之前火山引擎做的客戶調研,客戶心中理想的價格是怎樣的至關重要。
當然,視頻生成模型Seedance 1.0 pro也引發關注,實現了無縫多鏡頭敘事、多動作及隨心運鏡、穩定運動與真實美感。重要關注點同樣是「價格」。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,來到行業最低。
為了把價格卷到極致,今天的One more thing是豆包大模型“特惠區”,即對于輸入32K,輸出200以內的請求,豆包1.6價格將進一步降低到每百萬tokens輸入0.8元,輸出2元。
這意味,絕大部分non-thinking(不用思考)的需求,仍然可以繼續享受和豆包1.0一樣的“地板價”。
“卷價格”只為Agent走向規模化
譚待表示,深度思考、多模態和工具調用等模型能力提升,是構建Agent的關鍵要素。同時,由于Agent每次執行任務都會消耗大量tokens,模型使用成本也要降下來,才能推動Agent的規模化應用。
基于這樣的考量,火山引擎計劃按“輸入長度”區間定價,深度思考、多模態能力與基礎語言模型統一價格。比如,在企業使用量最大的0-32K輸入區間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,從而實現綜合成本只有豆包1.5深度思考模型的三分之一,即60%多。
成本一降再降,勢必助推Agent的生態的進一步繁榮,探訪豆包大模型展區網易科技發現,Agent應用占據篇幅最多,人群也更為聚集,沒有人再討論大模型的能力極限在哪里?所有人都在問,這個Agent能干什么?能產生什么真正的價值?
火山引擎的“陽謀”越來越明顯,Agent發展勢不可擋,那盡可能讓這個生態圍繞自己展開。
從數據來看,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發布時增長137倍。其中AI搜索增長10倍,AI 編程增長了8.4倍。視覺理解模型則是另一個助推器。比如,K12的在線教育,由于VLM模型能力不斷提升,Tokens消耗5個月增長了12倍,而新出現的智能巡檢,視頻檢索等數個場景也快速實現日均百億tokens的突破。
據IDC報告,豆包大模型在中國公有云大模型市場份額排名第一,占比46.4%。很明顯,豆包不滿足于此。
我們看到,豆包大模型已經涵蓋多模態、視頻、圖像、語音、音樂等模型品類。在行業應用上也在跑馬圈地,譚待透露,他們服務著全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校。
1.6能力如何?拿下高考數學全國狀元
據譚待披露,在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現已躋身全球前列。(在GPQA Diamond測評集上取得了81.5分,在AIME25獲得了86.3分。MultiChallenge上得分48分)
與此同時,豆包1.6模型支持多模態理解和圖形界面操作,能夠理解和處理真實世界問題。換句話說,這讓豆包1.6具備了“行動力”。案例顯示,豆包1.6可以自動操作瀏覽器完成酒店預定,識別購物小票并整理成Excel表格等任務。
而在大家更有體感的大模型做高考題環節,譚待提到,豆包1.6做高考全國新一卷數學單科成績是144分,全國第一。“而在高考前,我們針對海淀區模擬全卷進行了測評,豆包1.6相對去年的表現,理科成績顯著提升了154分,文科提升了90分。”譚待說。
“安全才是一切 Agent 運行的基礎”
講完價格和能力,再來看看開發者生態。
火山引擎針對開發者發布了一系列的順手工具。有火山引擎MCP服務、PromptPilot 智能提示工具、AI知識管理系統、veRL強化學習框架等,還有多模態數據湖、AICC私密計算、大模型應用防火墻,以及一系列AI Infra套件。
特別是針對企業數據和用戶隱私保護,如何防止惡意攻擊等安全挑戰,火山引擎發布的AICC私密計算、大模型應用防火墻已經開始落地,出現在聯想、中國銀聯、長安汽車等企業案例中。
字節跳動技術副總裁洪定坤認為,隨著模型能力的持續進步,AI有機會成為調度者,通過調用不同的 Agent 和工具,讓軟件開發“all in one”,更大幅度地降低開發門檻,提升開發效率。
洪定坤透露,豆包1.6模型在編程能力上進步很大,已經接入字節的AI編程產品TRAE內測,新模型將很快推送給用戶。洪定坤說,在字節內部,超過80%的工程師在使用TRAE輔助開發。TRAE 的整體月活用戶已經超過了100萬。
這一切都在推動 Agent 爆發提速。
譚待說,如果說24年是中國大模型應用的元年,那25年將很可能是中國Agent落地的元年。他認為技術主體經歷了三個時代變化,“PC時代主體是Web,移動時代是APP,AI時代則是Agent。”
而現在,軟件第一次從被動的工具,變成主動的執行者。