“你問我愛你有多深,我愛你有幾分,我的情也真,我的愛也真,月亮代表我的心。”2025年6月11日,在國家會(huì)議中心的會(huì)場,一首老歌響了起來。這并不是某位歌手的演唱會(huì),而是豆包大模型的AI演唱。如今的豆包大模型,既可自動(dòng)操作瀏覽器完成酒店預(yù)定,識(shí)別購物小票并整理成Excel表格等任務(wù),還讓瑞幸咖啡基于它打造了首個(gè)AI點(diǎn)單智能體,能夠?qū)崿F(xiàn)語音下單、猜你喜歡、點(diǎn)單更省時(shí)等功能,為用戶帶來“動(dòng)動(dòng)嘴就能點(diǎn)咖啡”的全新咖啡消費(fèi)體驗(yàn)。
就在當(dāng)天的會(huì)場,字節(jié)跳動(dòng)旗下火山引擎舉辦了Force原動(dòng)力大會(huì)。會(huì)上,火山引擎總裁譚待展示了豆包大模型的更多功能,他表示:“有媒體針對高考全國新一卷數(shù)學(xué)單科做了測評,豆包的成績是144分,全國第一。而在高考前,我們針對海淀區(qū)模擬全卷進(jìn)行了測評,豆包1.6相對2024年理科成績顯著提升了154分,文科提升了90分。”與此同時(shí),本次會(huì)上火山引擎還為大模型做了“上新”。當(dāng)天,其發(fā)布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級了Agent開發(fā)平臺(tái)等AI云原生服務(wù)。
性能躋身全球前排,價(jià)格“便宜大碗”
豆包1.6系列當(dāng)前由三個(gè)模型組成,分別是doubao-seed-1.6;doubao-seed-1.6-thinking和doubao-seed-1.6-flash。
doubao-seed-1.6是all-in-one的綜合模型,也是國內(nèi)首個(gè)支持256K上下文的思考模型,它支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。特別是在深度思考方面,開發(fā)者可以選擇關(guān)閉深度思考、開啟深度思考和自適應(yīng)思考三種方式。在自適應(yīng)思考模式之下,模型可以根據(jù)prompt難度自動(dòng)決定是否開啟thinking,在提升效果的前提之下可以大幅減少tokens開銷。
doubao-seed-1.6-thinking,是1.6系列在深度思考方面的強(qiáng)化版本,它只支持深度思考模式,但在coding、math、邏輯推理等基礎(chǔ)能力上都有進(jìn)一步提升,同時(shí)也支持256K上下文。
doubao-seed-1.6-flash,是1.6系列的極速版本。它同樣支持深度思考、多模態(tài)理解和256K窗口。但是,它的延遲極低輸出每個(gè) Token 的時(shí)間僅需10ms,適用于延遲敏感場景。其文本理解能力超過doubao 1.5 lite,視覺理解能力可以比肩友商旗艦?zāi)P汀?/p>
會(huì)上,火山引擎披露了豆包1.6模型的多項(xiàng)權(quán)威測評成績。在復(fù)雜推理、競賽級數(shù)學(xué)、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現(xiàn)已躋身全球前列。據(jù)譚待介紹,豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,能夠理解和處理真實(shí)世界問題。此前,豆包1.5的多模態(tài)能力在60個(gè)公開評測基準(zhǔn)中取得38項(xiàng)最佳成績,并已廣泛用于電商識(shí)圖、自動(dòng)駕駛數(shù)據(jù)標(biāo)注、門店巡檢等場景。圖形界面操作能力則讓豆包1.6進(jìn)一步具備“行動(dòng)力”。與此同時(shí),譚待還獨(dú)家揭秘了豆包APP的小流量DeepResearch功能。通過該功能,過去需要多名專業(yè)人士花費(fèi)數(shù)小時(shí)或者幾天寫成的調(diào)研報(bào)告,豆包可以在5-30分鐘內(nèi)完成,報(bào)告不僅內(nèi)容扎實(shí)、結(jié)構(gòu)嚴(yán)謹(jǐn),還能自動(dòng)提煉信息總結(jié)成網(wǎng)頁方便查閱。
豆包視頻生成模型Seedance 1.0 pro也在本次會(huì)上亮相。該模型支持文字與圖片輸入,能夠生成多鏡頭無縫切換的1080P高品質(zhì)視頻,主體運(yùn)動(dòng)穩(wěn)定性與畫面自然度較高。該模型還具備無縫多鏡頭的能力,這讓它能在幾秒的視頻中生成2個(gè)以上鏡頭的切換,并能伴隨著遠(yuǎn)中近景畫面變化,讓畫面的信息量和敘事能力大幅提升。基于以上模型特點(diǎn),火山引擎在電商、游戲和影視等場景使用Seedance 1.0 pro 分別做了嘗試。比如,在電商領(lǐng)域,無縫多鏡頭、多動(dòng)作多主體互動(dòng)等能力可以讓產(chǎn)品展示更加豐富。在影視領(lǐng)域,可以幫助從業(yè)人員快速驗(yàn)證分鏡與敘事邏輯,減少前期籌備成本。在游戲領(lǐng)域,其用網(wǎng)易出品的常青仙俠游戲《逆水寒》做了嘗試,讓用戶創(chuàng)作自己的角色故事“親身”演繹劇情。在國際知名評測榜單 Artificial Analysis 上,Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位。
目前,豆包大模型已涵蓋多模態(tài)、視頻、圖像、語音、音樂等模型品類,全方位推進(jìn)智能提升和應(yīng)用落地。在行業(yè)應(yīng)用上,豆包大模型服務(wù)著全球TOP10手機(jī)廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校。譚待表示:“在手機(jī)行業(yè),全球Top10手機(jī)廠商有9家和火山引擎深度合作。在汽車行業(yè),在剛剛過去的上海車展,豆包大模型是被最多提及的名詞,我們還攜手長安汽車解決大模型安全測評的合規(guī)風(fēng)險(xiǎn),護(hù)航智能化發(fā)展。在金融行業(yè),火山引擎已經(jīng)服務(wù)華泰證券、國信證券等數(shù)十家券商和基金公司,以及已經(jīng)服務(wù)招商銀行、浦發(fā)銀行、民生銀行等70%的重要性銀行。在教育行業(yè),火山引擎已與北京大學(xué)、浙江大學(xué)、南開大學(xué)等超五成985高校達(dá)成合作,持續(xù)推動(dòng)高等教育智能化轉(zhuǎn)型。”數(shù)據(jù)顯示,豆包大模型日均tokens使用量超過16.4萬億,較2024年5月首次發(fā)布時(shí)增長137倍。另據(jù)IDC報(bào)告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達(dá)46.4%。與此同時(shí),豆包1.6成本下降了63%,企業(yè)只需要原來三分之一左右價(jià)格,就能獲得一個(gè)能力更強(qiáng)的原生多模態(tài)新模型。
譚待表示,深度思考、多模態(tài)和工具調(diào)用等模型能力的提升,是構(gòu)建Agent的關(guān)鍵要素。同時(shí),由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens,因此只有把模型使用成本也降下來,才能推動(dòng)Agent的規(guī)模化應(yīng)用。而通過技術(shù)和商業(yè)的雙重創(chuàng)新,豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價(jià)格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為目前的行業(yè)最低。“另外,我們還觀察到一個(gè)數(shù)據(jù),那就是仍然存在大規(guī)模non-thinking模型的需求,而且這些請求的輸出都非常短。所以,這次我們還特別增設(shè)了一個(gè)特惠區(qū),對于輸入32K、輸出200以內(nèi)的請求,豆包1.6的價(jià)格將進(jìn)一步降低到每百萬tokens輸入0.8元和輸出2元。這意味著絕大部分的non-thinking需求,仍然可以繼續(xù)享受和豆包1.0一樣的超低價(jià)格。AI普惠,我們這次盡全力了。”譚待表示。
圖:火山引擎總裁譚待
發(fā)布兩款A(yù)I安全產(chǎn)品和三款A(yù)gent方案,讓Agent規(guī)模化應(yīng)用提速
為應(yīng)對Agent運(yùn)行的各類挑戰(zhàn),火山引擎發(fā)布了兩款A(yù)I安全產(chǎn)品:一是AICC密態(tài)計(jì)算,它通過用戶個(gè)人密鑰加密、CPU/GPU硬件可信環(huán)境計(jì)算推理、數(shù)據(jù)流轉(zhuǎn)落盤全密文的方式,在保障推理效果的前提下,讓企業(yè)像使用私部模型一樣安全合規(guī)的使用云端模型。二是大模型應(yīng)用防火墻,它脫胎于火山方舟每天十六萬億tokens服務(wù)的防護(hù)過程,通過精調(diào)的小參數(shù)模型、分層漏斗策略和流式送檢機(jī)制,低延遲、高精度的攔截攻擊變種,為企業(yè)智能體應(yīng)用構(gòu)建安全可信的大模型推理空間。通過這兩款產(chǎn)品,企業(yè)不僅可以安全的使用云上AI服務(wù)構(gòu)建端云協(xié)同體系,還能有效保障AI資產(chǎn)和服務(wù)資源。
與此同時(shí),火山引擎還發(fā)布了三個(gè)Agent方案:AgentKit,TrainingKit和ServingKit,幫助企業(yè)更高效地做好Agent服務(wù)、模型訓(xùn)練和模型推理。
AgentKit,是一套為企業(yè)級Agent打造的全棧開發(fā)和服務(wù)工具鏈。AgentKit 集成了豆包大模型,支持開源UI-Tars模型和最新豆包1.6模型,能夠幫助企業(yè)通過模型快速生成Agent邏輯和工具調(diào)用。針對Agent Sandbox環(huán)境,通過火山引擎veFaaS預(yù)置應(yīng)用模版可以實(shí)現(xiàn)開箱即用,并通過容器服務(wù)實(shí)現(xiàn)了分鐘級的 10 萬核高速擴(kuò)容能力,保障了應(yīng)用的可用性。與此同時(shí),火山引擎開發(fā)套件構(gòu)建了完整的工具生態(tài)體系,支持Computer Use、Browser Use、Phone Use等Tool Use,并覆蓋了數(shù)十類三方MCP Server,從而能夠大幅降低Agent開發(fā)的工程復(fù)雜性。
TrainingKit,是一款云原生訓(xùn)練套件,能實(shí)現(xiàn)高達(dá) 60%+ 的MFU(算力利用率),在萬卡集群、千億參數(shù)模型訓(xùn)練的集群上,算力利用率相比提升了30%。同時(shí)面向后訓(xùn)練環(huán)節(jié),Training Kit通過 veRL 框架、 Sandbox 百萬核秒并發(fā)能力,能夠有效提升后訓(xùn)練效率,為 AI 訓(xùn)練全流程筑牢技術(shù)底座。
ServingKit,是面向模型部署與推理的AI云原生推理套件,能從模型部署、在線推理、服務(wù)運(yùn)維三個(gè)階段進(jìn)行加速和提效。特別是在推理優(yōu)化階段,它能始終保持開放兼容,廣泛地支持開源推理框架,并能針對主流模型進(jìn)行算子優(yōu)化,性能相比社區(qū)最新版本提升2-3倍。
字節(jié)跳動(dòng)技術(shù)副總裁洪定坤認(rèn)為,隨著模型能力的持續(xù)進(jìn)步,AI將有機(jī)會(huì)成為調(diào)度者,通過調(diào)用不同的 Agent 和工具,讓軟件開發(fā)“all in one”,從而能夠更大幅度地降低開發(fā)門檻,提升開發(fā)效率。洪定坤表示,豆包1.6模型在編程能力上進(jìn)步很大,目前已經(jīng)接入字節(jié)的AI編程產(chǎn)品TRAE內(nèi)測,新模型將很快推送給用戶。據(jù)洪定坤透露,在字節(jié)內(nèi)部,超過80%的工程師在使用TRAE輔助開發(fā)。TRAE 的整體月活用戶已經(jīng)超過了 100 萬。在演講中洪定坤舉例稱:“我們一位研發(fā)同事的孩子大概11歲,最近這個(gè)孩子在做一些奧數(shù)題目,他覺得用紙做的方式不是很方便,而網(wǎng)上有各種不同題目,于是他想有沒有可能做一個(gè)小網(wǎng)站把這些題目自動(dòng)抓下來。于是,這名孩子使用TRAE開發(fā)了一個(gè)網(wǎng)站,這是一個(gè)真實(shí)的網(wǎng)站,可以在上面做題。由此可見,一個(gè)11歲的小朋友,在AI的幫助下也能很快地通過自己學(xué)習(xí)完成一次開發(fā)和生成一個(gè)應(yīng)用。”
圖:字節(jié)跳動(dòng)技術(shù)副總裁洪定坤
可以說,在AI時(shí)代,開發(fā)范式將首先發(fā)生重大變化。過去,無論是LAMP、SOA還是容器化、微服務(wù),本質(zhì)都是通過程序員來編寫算法和規(guī)則。而在AI時(shí)代,調(diào)用中心從程序員轉(zhuǎn)移到大模型。大模型和Agent開發(fā)平臺(tái)是AI時(shí)代的關(guān)鍵要素。模型只有實(shí)現(xiàn)強(qiáng)推理、多模態(tài)和低成本,才能支撐好Agent的大規(guī)模應(yīng)用。同時(shí),需要提供強(qiáng)化學(xué)習(xí)、Prompt優(yōu)化、MCP Hub、知識(shí)庫、運(yùn)行沙盒等開發(fā)平臺(tái),以便基于模型開發(fā)出更好的Agent。
譚待認(rèn)為,技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化,AI時(shí)代會(huì)推動(dòng)開發(fā)范式與技術(shù)架構(gòu)全面升級。他說:“PC時(shí)代主體是Web,移動(dòng)時(shí)代是APP,AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代,助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent。”他總結(jié)稱:“我們(得到認(rèn)可)的訣竅就是心誠,就是你真心想做這件事情,不是把不好的模型免費(fèi)賺一個(gè)吆喝說你看我賦能了多少開發(fā)者,而是要讓更多人運(yùn)用AI創(chuàng)造價(jià)值。這之中主要涉及到三件事:把模型做好、把成本做低、以及把應(yīng)用性和落地性工具做好”。同時(shí),譚待還表示:“目前模型帶來的業(yè)績增長在所有產(chǎn)品中是最快的,同時(shí)也遠(yuǎn)超其他產(chǎn)品,而且也是毛利最好的產(chǎn)品之一,我覺得這個(gè)業(yè)務(wù)還是非常值得期待的。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.