摘要:
截至2025年3月,豆包大模型日均tokens使用量超12.7萬(wàn)億,較發(fā)布之初增長(zhǎng)超106倍。
豆包1.5深度思考模型正式發(fā)布
4月17日,火山引擎正式發(fā)布豆包1.5·深度思考模型,包含語(yǔ)言版和視覺(jué)版。其中語(yǔ)言模型采用MoE架構(gòu),總參數(shù)為200B,激活參數(shù)僅20B。基于高效算法和高性能推理系統(tǒng),豆包模型API服務(wù)在保障高并發(fā)的同時(shí),延遲低至20毫秒。
據(jù)火山引擎總裁譚待介紹,豆包1.5?深度思考模型(Doubao-1.5-thinking-pro)在數(shù)學(xué)、代碼、科學(xué)等專(zhuān)業(yè)領(lǐng)域推理任務(wù)中表現(xiàn)出色,已經(jīng)達(dá)到或接近全球第一梯隊(duì)水平。具體而言,數(shù)學(xué)推理AIME 2024 測(cè)試得分追平OpenAI o3-mini-high,編程競(jìng)賽和科學(xué)推理測(cè)試成績(jī)也接近o1,在高難度通用人工智能測(cè)試ARC-AGI上,其得分更是超過(guò)了OpenAI o1和o3-mini-high。
在創(chuàng)意寫(xiě)作、人文知識(shí)問(wèn)答等通用任務(wù)上,模型也展示出優(yōu)秀的泛化能力,能勝任更廣泛的使用場(chǎng)景。
為什么要推出這樣一款深度思考模型?
答案是:市場(chǎng)需要。
隨著企業(yè)AI應(yīng)用不斷深入,行業(yè)對(duì)AI技術(shù)提出了更高要求。人們希望AI能夠從單純的信息處理升級(jí)為端到端的任務(wù)執(zhí)行者。比如能完整規(guī)劃行程并訂票、為研究人員生成行業(yè)分析報(bào)告,甚至為產(chǎn)品經(jīng)理開(kāi)發(fā)可運(yùn)行應(yīng)用。只有實(shí)現(xiàn)這些復(fù)雜任務(wù)處理能力,才能稱(chēng)得上真正的AI Agent。而這一切的背后,最核心的是要有一款強(qiáng)大的模型做支撐,因此也就催生了今天的豆包1.5·深度思考模型。
舉個(gè)示例感受新模型的深度思考能力:
先來(lái)讓它分析下復(fù)雜的財(cái)報(bào),提示詞輸入:請(qǐng)分析一下可口可樂(lè)24財(cái)年的收入報(bào)告中,不同區(qū)域間的差異顯著,背后的驅(qū)動(dòng)因素是什么?公司在不同地區(qū)的定價(jià)策略和產(chǎn)品組合如何影響收入結(jié)構(gòu)?
可以看到它能拆分并理解用戶(hù)提問(wèn),解讀英文報(bào)表,提煉有效信息,然后基于信息提煉進(jìn)行深度分析,最終給出詳細(xì)的解答和建議。
但上述能力,類(lèi)似的推理模型產(chǎn)品也同樣具備,豆包1.5·深度思考模型有什么特別之處?
豆包1.5·深度思考模型專(zhuān)門(mén)打造了視覺(jué)版,具備視覺(jué)理解能力,可以像人類(lèi)一樣,閱讀文字,看圖片就能進(jìn)行思考,讓模型同時(shí)擁有“大腦”和“眼睛”。
例如,讓豆包深度思考模型視覺(jué)版幫忙閱讀菜單然后點(diǎn)餐,提示詞輸入“一家四口去國(guó)外旅行,去餐廳點(diǎn)餐,其中有一位老人和一個(gè)孩子,預(yù)算800元人民幣以?xún)?nèi),孩子對(duì)海鮮過(guò)敏,給推薦一下如何點(diǎn)餐吧1”
模型很快就能理解菜單內(nèi)容,分析每道菜的組成、照顧不同人的口味和過(guò)敏食物,給出預(yù)算內(nèi)的點(diǎn)餐推薦。
Agent元年開(kāi)啟,火山引擎上線(xiàn)超實(shí)用工具
2025年被業(yè)界視為“Agent智能體元年”。那么,到底什么樣的Agent才能在真實(shí)世界和數(shù)字世界中完成端到端的復(fù)雜任務(wù)?
首先,模型需要有能力做好思考、計(jì)劃和反思,而且要一定得支持多模態(tài)。因?yàn)檎鎸?shí)世界的任務(wù)需要耳朵、嘴巴和眼睛來(lái)共同完成;
其次,要有更好的架構(gòu)和工具來(lái)支持大模型去操作數(shù)字和物理世界;
第三,要通過(guò)AI云原生,不斷降低模型推理的成本和延遲,推動(dòng)應(yīng)用普惠。
這就意味著,光有強(qiáng)大的模型還不夠,還要有更好的架構(gòu)和工具來(lái)支撐。
為此,火山引擎宣布推出OS Agent解決方案,并演示了由Agent操作瀏覽器,搜索商品頁(yè),實(shí)現(xiàn)iPhone比價(jià)的任務(wù)。
據(jù)悉,OS Agent解決方案包含豆包UI-TARS模型,以及veFaaS函數(shù)服務(wù)、云服務(wù)器、云手機(jī)等產(chǎn)品,實(shí)現(xiàn)對(duì)代碼、瀏覽器、電腦、手機(jī)以及其他Agent的操作。其中,豆包UI-TARS模型將屏幕視覺(jué)理解、邏輯推理、界面元素定位和操作整合在一起,突破傳統(tǒng)自動(dòng)化工具依賴(lài)預(yù)設(shè)規(guī)則的局限性,為Agent的智能交互提供了更接近人類(lèi)操作的模型基礎(chǔ)。
好的模型和工具能夠加速Agent的落地,但Agent也會(huì)帶來(lái)更大量的模型推理消耗。面對(duì)大規(guī)模推理需求,火山引擎專(zhuān)門(mén)打造了AI云原生ServingKit 推理套件,讓模型部署更快、推理成本更低,GPU 消耗相比傳統(tǒng)方案降低80%。
此外,豆包文生圖模型Seedream3.0也正式向企業(yè)開(kāi)放。該模型已在即夢(mèng)AI、豆包產(chǎn)品上線(xiàn),并在近期登上權(quán)威競(jìng)技場(chǎng)Artificial Analysis文生圖榜單第一梯隊(duì)。Seedream3.0支持2K分辨率直出,生圖結(jié)構(gòu)準(zhǔn)確性、小字生成與排版、美感、真實(shí)度等方面具有優(yōu)勢(shì)。
日均調(diào)用量超12.7萬(wàn)億,豆包賦能千行百業(yè)數(shù)智升級(jí)
數(shù)據(jù)顯示,截至2025年3月底,豆包大模型日均token調(diào)用量已超過(guò)12.7萬(wàn)億,是2024年12月的3倍,是一年前剛剛發(fā)布時(shí)的106倍。IDC報(bào)告顯示,2024年中國(guó)公有云大模型調(diào)用量激增,火山引擎以46.4%的市場(chǎng)份額位居中國(guó)市場(chǎng)第一。
這些數(shù)據(jù)背后,證明了豆包大模型已經(jīng)憑借卓越的性能和場(chǎng)景化能力,成為眾多企業(yè)AI轉(zhuǎn)型的核心驅(qū)動(dòng)力。從辦公軟件、汽車(chē)制造到高等教育、金融科技,豆包大模型通過(guò)深度合作與創(chuàng)新應(yīng)用,持續(xù)推動(dòng)各行業(yè)生產(chǎn)力變革。
- 在辦公領(lǐng)域,金山辦公作為國(guó)內(nèi)辦公軟件領(lǐng)軍企業(yè),基于豆包大模型推出AI智能助手“靈犀”,覆蓋文檔處理、創(chuàng)意寫(xiě)作、信息檢索等場(chǎng)景,未來(lái)將進(jìn)一步拓展至文字、表格、演示、PDF等全辦公鏈路,助力用戶(hù)提升效率;
- 在汽車(chē)領(lǐng)域,豆包大模型成為智能座艙的“大腦”。梅賽德斯-奔馳通過(guò)集成豆包模型,顯著提升了信息檢索速度和系統(tǒng)響應(yīng)能力,并在語(yǔ)音交互、導(dǎo)航、娛樂(lè)等場(chǎng)景持續(xù)探索。目前,近80%的主流汽車(chē)品牌選擇豆包作為智能化升級(jí)合作伙伴。
- 在教育領(lǐng)域,浙江大學(xué)依托火山引擎HiAgent平臺(tái)和豆包大模型,僅用一周便上線(xiàn)“浙大先生”智能體平臺(tái),支持AI科學(xué)家、課堂答疑、教務(wù)咨詢(xún)等場(chǎng)景的定制開(kāi)發(fā),服務(wù)超5萬(wàn)名師生。據(jù)悉,C9高校中已有六所與火山引擎展開(kāi)合作。
- 在金融領(lǐng)域,杭州銀行聯(lián)合火山引擎推出電商生態(tài)云“百業(yè)云”,通過(guò)豆包大模型為中小商家提供智能客服服務(wù),實(shí)現(xiàn)7*24小時(shí)高準(zhǔn)確率響應(yīng),重塑金融服務(wù)體驗(yàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.