火山引擎譚待：“AI普惠，我們這次盡全力了”

2025-06-13 16:44:17　來源: DeepTech深科技

北京舉報(bào)

分享至

“你問我愛你有多深，我愛你有幾分，我的情也真，我的愛也真，月亮代表我的心。”2025年6月11日，在國家會(huì)議中心的會(huì)場，一首老歌響了起來。這并不是某位歌手的演唱會(huì)，而是豆包大模型的AI演唱。如今的豆包大模型，既可自動(dòng)操作瀏覽器完成酒店預(yù)定，識(shí)別購物小票并整理成Excel表格等任務(wù)，還讓瑞幸咖啡基于它打造了首個(gè)AI點(diǎn)單智能體，能夠?qū)崿F(xiàn)語音下單、猜你喜歡、點(diǎn)單更省時(shí)等功能，為用戶帶來“動(dòng)動(dòng)嘴就能點(diǎn)咖啡”的全新咖啡消費(fèi)體驗(yàn)。

就在當(dāng)天的會(huì)場，字節(jié)跳動(dòng)旗下火山引擎舉辦了Force原動(dòng)力大會(huì)。會(huì)上，火山引擎總裁譚待展示了豆包大模型的更多功能，他表示：“有媒體針對高考全國新一卷數(shù)學(xué)單科做了測評，豆包的成績是144分，全國第一。而在高考前，我們針對海淀區(qū)模擬全卷進(jìn)行了測評，豆包1.6相對2024年理科成績顯著提升了154分，文科提升了90分。”與此同時(shí)，本次會(huì)上火山引擎還為大模型做了“上新”。當(dāng)天，其發(fā)布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型，并升級了Agent開發(fā)平臺(tái)等AI云原生服務(wù)。

性能躋身全球前排，價(jià)格“便宜大碗”

豆包1.6系列當(dāng)前由三個(gè)模型組成，分別是doubao-seed-1.6；doubao-seed-1.6-thinking和doubao-seed-1.6-flash。

doubao-seed-1.6是all-in-one的綜合模型，也是國內(nèi)首個(gè)支持256K上下文的思考模型，它支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。特別是在深度思考方面，開發(fā)者可以選擇關(guān)閉深度思考、開啟深度思考和自適應(yīng)思考三種方式。在自適應(yīng)思考模式之下，模型可以根據(jù)prompt難度自動(dòng)決定是否開啟thinking，在提升效果的前提之下可以大幅減少tokens開銷。

doubao-seed-1.6-thinking，是1.6系列在深度思考方面的強(qiáng)化版本，它只支持深度思考模式，但在coding、math、邏輯推理等基礎(chǔ)能力上都有進(jìn)一步提升，同時(shí)也支持256K上下文。

doubao-seed-1.6-flash，是1.6系列的極速版本。它同樣支持深度思考、多模態(tài)理解和256K窗口。但是，它的延遲極低輸出每個(gè) Token 的時(shí)間僅需10ms，適用于延遲敏感場景。其文本理解能力超過doubao 1.5 lite，視覺理解能力可以比肩友商旗艦?zāi)Ｐ汀?/p>

會(huì)上，火山引擎披露了豆包1.6模型的多項(xiàng)權(quán)威測評成績。在復(fù)雜推理、競賽級數(shù)學(xué)、多輪對話和指令遵循等測試集上，豆包1.6-thinking的表現(xiàn)已躋身全球前列。據(jù)譚待介紹，豆包1.6系列模型支持多模態(tài)理解和圖形界面操作，能夠理解和處理真實(shí)世界問題。此前，豆包1.5的多模態(tài)能力在60個(gè)公開評測基準(zhǔn)中取得38項(xiàng)最佳成績，并已廣泛用于電商識(shí)圖、自動(dòng)駕駛數(shù)據(jù)標(biāo)注、門店巡檢等場景。圖形界面操作能力則讓豆包1.6進(jìn)一步具備“行動(dòng)力”。與此同時(shí)，譚待還獨(dú)家揭秘了豆包APP的小流量DeepResearch功能。通過該功能，過去需要多名專業(yè)人士花費(fèi)數(shù)小時(shí)或者幾天寫成的調(diào)研報(bào)告，豆包可以在5-30分鐘內(nèi)完成，報(bào)告不僅內(nèi)容扎實(shí)、結(jié)構(gòu)嚴(yán)謹(jǐn)，還能自動(dòng)提煉信息總結(jié)成網(wǎng)頁方便查閱。

豆包視頻生成模型Seedance 1.0 pro也在本次會(huì)上亮相。該模型支持文字與圖片輸入，能夠生成多鏡頭無縫切換的1080P高品質(zhì)視頻，主體運(yùn)動(dòng)穩(wěn)定性與畫面自然度較高。該模型還具備無縫多鏡頭的能力，這讓它能在幾秒的視頻中生成2個(gè)以上鏡頭的切換，并能伴隨著遠(yuǎn)中近景畫面變化，讓畫面的信息量和敘事能力大幅提升。基于以上模型特點(diǎn)，火山引擎在電商、游戲和影視等場景使用Seedance 1.0 pro 分別做了嘗試。比如，在電商領(lǐng)域，無縫多鏡頭、多動(dòng)作多主體互動(dòng)等能力可以讓產(chǎn)品展示更加豐富。在影視領(lǐng)域，可以幫助從業(yè)人員快速驗(yàn)證分鏡與敘事邏輯，減少前期籌備成本。在游戲領(lǐng)域，其用網(wǎng)易出品的常青仙俠游戲《逆水寒》做了嘗試，讓用戶創(chuàng)作自己的角色故事“親身”演繹劇情。在國際知名評測榜單 Artificial Analysis 上，Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位。

目前，豆包大模型已涵蓋多模態(tài)、視頻、圖像、語音、音樂等模型品類，全方位推進(jìn)智能提升和應(yīng)用落地。在行業(yè)應(yīng)用上，豆包大模型服務(wù)著全球TOP10手機(jī)廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校。譚待表示：“在手機(jī)行業(yè)，全球Top10手機(jī)廠商有9家和火山引擎深度合作。在汽車行業(yè)，在剛剛過去的上海車展，豆包大模型是被最多提及的名詞，我們還攜手長安汽車解決大模型安全測評的合規(guī)風(fēng)險(xiǎn)，護(hù)航智能化發(fā)展。在金融行業(yè)，火山引擎已經(jīng)服務(wù)華泰證券、國信證券等數(shù)十家券商和基金公司，以及已經(jīng)服務(wù)招商銀行、浦發(fā)銀行、民生銀行等70%的重要性銀行。在教育行業(yè)，火山引擎已與北京大學(xué)、浙江大學(xué)、南開大學(xué)等超五成985高校達(dá)成合作，持續(xù)推動(dòng)高等教育智能化轉(zhuǎn)型。”數(shù)據(jù)顯示，豆包大模型日均tokens使用量超過16.4萬億，較2024年5月首次發(fā)布時(shí)增長137倍。另據(jù)IDC報(bào)告，豆包大模型在中國公有云大模型市場份額排名第一，占比高達(dá)46.4%。與此同時(shí)，豆包1.6成本下降了63%，企業(yè)只需要原來三分之一左右價(jià)格，就能獲得一個(gè)能力更強(qiáng)的原生多模態(tài)新模型。

譚待表示，深度思考、多模態(tài)和工具調(diào)用等模型能力的提升，是構(gòu)建Agent的關(guān)鍵要素。同時(shí)，由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens，因此只有把模型使用成本也降下來，才能推動(dòng)Agent的規(guī)模化應(yīng)用。而通過技術(shù)和商業(yè)的雙重創(chuàng)新，豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價(jià)，深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價(jià)格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間，豆包1.6的輸入價(jià)格為0.8元/百萬tokens、輸出8元/百萬tokens，綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元，每生成一條5秒的1080P視頻只需3.67元，為目前的行業(yè)最低。“另外，我們還觀察到一個(gè)數(shù)據(jù)，那就是仍然存在大規(guī)模non-thinking模型的需求，而且這些請求的輸出都非常短。所以，這次我們還特別增設(shè)了一個(gè)特惠區(qū)，對于輸入32K、輸出200以內(nèi)的請求，豆包1.6的價(jià)格將進(jìn)一步降低到每百萬tokens輸入0.8元和輸出2元。這意味著絕大部分的non-thinking需求，仍然可以繼續(xù)享受和豆包1.0一樣的超低價(jià)格。AI普惠，我們這次盡全力了。”譚待表示。

圖：火山引擎總裁譚待

發(fā)布兩款A(yù)I安全產(chǎn)品和三款A(yù)gent方案，讓Agent規(guī)模化應(yīng)用提速

為應(yīng)對Agent運(yùn)行的各類挑戰(zhàn)，火山引擎發(fā)布了兩款A(yù)I安全產(chǎn)品：一是AICC密態(tài)計(jì)算，它通過用戶個(gè)人密鑰加密、CPU/GPU硬件可信環(huán)境計(jì)算推理、數(shù)據(jù)流轉(zhuǎn)落盤全密文的方式，在保障推理效果的前提下，讓企業(yè)像使用私部模型一樣安全合規(guī)的使用云端模型。二是大模型應(yīng)用防火墻，它脫胎于火山方舟每天十六萬億tokens服務(wù)的防護(hù)過程，通過精調(diào)的小參數(shù)模型、分層漏斗策略和流式送檢機(jī)制，低延遲、高精度的攔截攻擊變種，為企業(yè)智能體應(yīng)用構(gòu)建安全可信的大模型推理空間。通過這兩款產(chǎn)品，企業(yè)不僅可以安全的使用云上AI服務(wù)構(gòu)建端云協(xié)同體系，還能有效保障AI資產(chǎn)和服務(wù)資源。

與此同時(shí)，火山引擎還發(fā)布了三個(gè)Agent方案：AgentKit，TrainingKit和ServingKit，幫助企業(yè)更高效地做好Agent服務(wù)、模型訓(xùn)練和模型推理。

AgentKit，是一套為企業(yè)級Agent打造的全棧開發(fā)和服務(wù)工具鏈。AgentKit 集成了豆包大模型，支持開源UI-Tars模型和最新豆包1.6模型，能夠幫助企業(yè)通過模型快速生成Agent邏輯和工具調(diào)用。針對Agent Sandbox環(huán)境，通過火山引擎veFaaS預(yù)置應(yīng)用模版可以實(shí)現(xiàn)開箱即用，并通過容器服務(wù)實(shí)現(xiàn)了分鐘級的 10 萬核高速擴(kuò)容能力，保障了應(yīng)用的可用性。與此同時(shí)，火山引擎開發(fā)套件構(gòu)建了完整的工具生態(tài)體系，支持Computer Use、Browser Use、Phone Use等Tool Use，并覆蓋了數(shù)十類三方MCP Server，從而能夠大幅降低Agent開發(fā)的工程復(fù)雜性。

TrainingKit，是一款云原生訓(xùn)練套件，能實(shí)現(xiàn)高達(dá) 60%+ 的MFU（算力利用率），在萬卡集群、千億參數(shù)模型訓(xùn)練的集群上，算力利用率相比提升了30%。同時(shí)面向后訓(xùn)練環(huán)節(jié)，Training Kit通過 veRL 框架、 Sandbox 百萬核秒并發(fā)能力，能夠有效提升后訓(xùn)練效率，為 AI 訓(xùn)練全流程筑牢技術(shù)底座。

ServingKit，是面向模型部署與推理的AI云原生推理套件，能從模型部署、在線推理、服務(wù)運(yùn)維三個(gè)階段進(jìn)行加速和提效。特別是在推理優(yōu)化階段，它能始終保持開放兼容，廣泛地支持開源推理框架，并能針對主流模型進(jìn)行算子優(yōu)化，性能相比社區(qū)最新版本提升2-3倍。

字節(jié)跳動(dòng)技術(shù)副總裁洪定坤認(rèn)為，隨著模型能力的持續(xù)進(jìn)步，AI將有機(jī)會(huì)成為調(diào)度者，通過調(diào)用不同的 Agent 和工具，讓軟件開發(fā)“all in one”，從而能夠更大幅度地降低開發(fā)門檻，提升開發(fā)效率。洪定坤表示，豆包1.6模型在編程能力上進(jìn)步很大，目前已經(jīng)接入字節(jié)的AI編程產(chǎn)品TRAE內(nèi)測，新模型將很快推送給用戶。據(jù)洪定坤透露，在字節(jié)內(nèi)部，超過80%的工程師在使用TRAE輔助開發(fā)。TRAE 的整體月活用戶已經(jīng)超過了 100 萬。在演講中洪定坤舉例稱：“我們一位研發(fā)同事的孩子大概11歲，最近這個(gè)孩子在做一些奧數(shù)題目，他覺得用紙做的方式不是很方便，而網(wǎng)上有各種不同題目，于是他想有沒有可能做一個(gè)小網(wǎng)站把這些題目自動(dòng)抓下來。于是，這名孩子使用TRAE開發(fā)了一個(gè)網(wǎng)站，這是一個(gè)真實(shí)的網(wǎng)站，可以在上面做題。由此可見，一個(gè)11歲的小朋友，在AI的幫助下也能很快地通過自己學(xué)習(xí)完成一次開發(fā)和生成一個(gè)應(yīng)用。”

圖：字節(jié)跳動(dòng)技術(shù)副總裁洪定坤

可以說，在AI時(shí)代，開發(fā)范式將首先發(fā)生重大變化。過去，無論是LAMP、SOA還是容器化、微服務(wù)，本質(zhì)都是通過程序員來編寫算法和規(guī)則。而在AI時(shí)代，調(diào)用中心從程序員轉(zhuǎn)移到大模型。大模型和Agent開發(fā)平臺(tái)是AI時(shí)代的關(guān)鍵要素。模型只有實(shí)現(xiàn)強(qiáng)推理、多模態(tài)和低成本，才能支撐好Agent的大規(guī)模應(yīng)用。同時(shí)，需要提供強(qiáng)化學(xué)習(xí)、Prompt優(yōu)化、MCP Hub、知識(shí)庫、運(yùn)行沙盒等開發(fā)平臺(tái)，以便基于模型開發(fā)出更好的Agent。

譚待認(rèn)為，技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化，AI時(shí)代會(huì)推動(dòng)開發(fā)范式與技術(shù)架構(gòu)全面升級。他說：“PC時(shí)代主體是Web，移動(dòng)時(shí)代是APP，AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思，完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代，助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent。”他總結(jié)稱：“我們（得到認(rèn)可）的訣竅就是心誠，就是你真心想做這件事情，不是把不好的模型免費(fèi)賺一個(gè)吆喝說你看我賦能了多少開發(fā)者，而是要讓更多人運(yùn)用AI創(chuàng)造價(jià)值。這之中主要涉及到三件事：把模型做好、把成本做低、以及把應(yīng)用性和落地性工具做好”。同時(shí)，譚待還表示：“目前模型帶來的業(yè)績增長在所有產(chǎn)品中是最快的，同時(shí)也遠(yuǎn)超其他產(chǎn)品，而且也是毛利最好的產(chǎn)品之一，我覺得這個(gè)業(yè)務(wù)還是非常值得期待的。”

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.