網易首頁 > 網易號 > 正文申請入駐

豆包1.5深度思考模型發布：暴砍參數量，能看圖思考，數學編程超DeepSeek-R1

2025-04-17 16:02:49　來源: 智東西

北京舉報

分享至

智東西
作者陳駿達
編輯心緣

智東西4月17日報道，今天，火山引擎正式發布了豆包1.5·深度思考模型，采用MoE架構，總參數量為200B，激活參數僅20B，在多項基準測試中達到或接近全球第一梯隊水平。

在數學、編程、科學領域，豆包1.5·深度思考模型的測試表現超過DeepSeek-R1、QwQ-32B等國產推理模型，與OpenAI o1、o3-mini-high等模型能力相仿。在高難度通用人工智能測試ARC-AGI上，其得分更是超過了OpenAI o1和o3-mini-high。

豆包1.5·深度思考模型具有“邊想邊搜”、“視覺理解”等實用能力，即日起，企業用戶可以在火山方舟平臺使用豆包1.5·深度思考模型。火山引擎還升級了豆包·文生圖模型3.0、豆包·視覺理解模型。

數據顯示，截至2025年3月底，豆包大模型日均tokens調用量已超過12.7萬億，是2024年12月的3倍，是一年前剛剛發布時的106倍。IDC報告顯示，2024年中國公有云大模型調用量激增，火山引擎以46.4%的市場份額位居中國市場第一。

一、高并發場景延遲僅20毫秒，可邊想邊搜、視覺理解

豆包1.5·深度思考模型較小的參數量和激活參數量，使其具備更低的訓練和推理成本，可在高并發場景實現20毫秒低延遲。

搜索能力是豆包1.5·深度思考模型的亮點之一。與其他推理模型“先搜索再思考”的模式不同，豆包App基于豆包1.5·深度思考模型進行了定向訓練，可以“邊想邊搜”。

例如，在給用戶推薦露營裝備時，豆包1.5·深度思考模型可以拆解每個具體需求的注意事項，規劃信息，自行判斷信息是否完備，并補充搜索信息。在3輪搜索后，豆包1.5·深度思考模型給出了預算范圍內、細致周到的推薦。

豆包1.5·深度思考模型還具備視覺理解能力，能基于文字、圖像信息進行思考。在下方場景中，豆包1.5·深度思考模型就做到了理解菜單內容，分析每道菜的組成、照顧不同人的口味和過敏食物，給出預算內的點餐推薦。

據火山引擎介紹，為了提升豆包1.5·深度思考模型的通用能力，模型團隊優化了數據處理策略，把可驗證數據與創意性數據進行融合處理，滿足各類任務的需求。

此外，大規模強化學習是訓練推理模型的關鍵技術，通過采用創新的雙軌獎勵機制，兼顧“對錯分明”和“見仁見智”的任務，有效實現了算法的可靠優化。

二、多項跑分打平OpenAI推理模型，AGI測試優勢明顯

火山引擎公布了豆包1.5·深度思考模型在多項權威基準測試上的跑分結果。

在AIME 2024、AIME 2025這類數學測試中，豆包1.5·深度思考模型的得分與OpenAI o3-mini-high基本打平，但在難度更高的Beyond AIME上仍與后者有明顯差距。

在博士級推理難題測試集GPQA Diamond上，豆包1.5·深度思考模型的得分為77.3，與OpenAI o1、o3-mini-high僅有微小差距。

在編程基準測試Code Forces和SWE-bench上，豆包1.5·深度思考模型實現了接近或超越DeepSeek-R1的成績。

在高難度通用人工智能測試ARC-AGI上，其得分更是大幅超過了OpenAI o1和o3-mini-high，達39.9分。

在創意寫作等非推理任務中，豆包1.5·深度思考模型也展示出泛化能力，能夠勝任更廣泛和復雜的使用場景。

三、直出2K高清圖片，還能搜索視頻內容

全新升級的豆包·文生圖模型3.0，能夠實現更好的文字排版表現、實拍級的圖像生成效果，以及2K的高清圖片生成方式。

▲豆包·文生圖模型3.0生成的2K人像（圖源：火山引擎）

豆包·文生圖模型3.0還可廣泛應用于影視、海報、繪畫、玩偶設計等營銷、電商、設計場景，生成的文字準確無誤，畫面有設計感。

▲豆包·文生圖模型3.0生成的海報（圖源：火山引擎）

在最新的文生圖領域權威榜單Artificial Analysis競技場中，豆包·文生圖3.0模型已超越業界諸多主流模型，排名全球第一梯隊。

新版本的豆包·視覺理解模型則具備更強的視覺定位能力，支持多目標、小目標、通用目標的框定位和點定位，并支持定位計數、描述定位內容、3D定位。可應用于線下門店的巡檢場景、GUI agent、機器人訓練、自動駕駛訓練等。

將一盒草莓的圖片發送給豆包·視覺理解模型，它能迅速數出有多少草莓，并框定其位置。

同時，新版本在視頻理解能力上也有大幅提升，比如記憶、總結理解、速度感知、長視頻理解等。豆包·視覺理解模型結合向量搜索，可直接對視頻進行語義搜索，廣泛適用于安防、家庭看護等商業化場景。

結語：國產推理模型角逐激烈

推理模型已經成為國內各大模型廠商角逐的重要方向。本次豆包1.5·深度思考模型在推理成本、視覺理解等方面的新能力，或許將成為下一輪推理模型升級的重要方向。

同日，火山引擎還發布了OS Agent解決方案、GUI Agent大模型（豆包1.5·UI-TARS）；面向大規模推理，發布AI云原生·ServingKit推理套件。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI說書媲美真人！豆包語音大模型升級長上下文理解

量子位 2025-02-26 15:23:35
19 跟貼 19
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0

Recraft爆紅，我們和創始人聊了聊

鈦媒體APP 2025-01-08 17:09:32
1 跟貼 1

AI作圖，拯救“職場牛馬”

鈦媒體APP 2025-01-17 13:25:28
1 跟貼 1
25位IT大佬親述：AI「吃掉」程序員！碼農黃金時代終結

新智元 2025-05-03 15:05:05
28 跟貼 28

AI教父Hinton警告：有志于編程，不必讀大學！

新智元 2025-05-05 09:17:01
0 跟貼 0

比爾蓋茨曾是熊孩子：16歲徒步數百英里，邊走腦中邊寫BASIC代碼

量子位 2025-02-13 14:31:27
0 跟貼 0
3B模型逆襲7B巨頭！Video-XL-Pro突破長視頻理解極限

量子位 2025-05-04 22:44:21
1 跟貼 1

AI 時代的超級應用，是一個超級框

愛范兒 2025-03-13 11:56:19
0 跟貼 0
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
DeepSeek的橫空出世，讓AI+騰訊云數據庫產生了什么化學反應？

量子位 2025-03-04 20:07:47
0 跟貼 0
AI長身體，直接做實驗！自主通用科學家，科研界的Scaling Law來了

新智元 2025-05-04 13:27:55
2 跟貼 2
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
AGI失控率＞90%！MIT教授算出「康普頓常數」，AI地球「奪權率」已鎖定？

新智元 2025-05-04 15:04:35
0 跟貼 0
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0
DeepSeek應用如何落地？解鎖性能釋放x多模態融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
strawberry單詞中一共有幾個 r ？去問你的DeepSeek，你會回來的

果殼 2025-05-01 16:07:10
15 跟貼 15
男人帶著一個布加迪汽車模型，來到當鋪就要賣500萬美刀，紀錄片

新鮮尋寶 2025-05-02 20:02:53
42 跟貼 42
大媽端著臟水倒進電梯縫隙倒完后顯示屏數字顯示消失

大目看點 2025-05-04 17:21:58
9164 跟貼 9164
用DeepSeek制作Excel圖表，你還不會就out啦！

秋葉PPT 2025-05-04 08:21:05
0 跟貼 0
一點都“不想上班”！動物園3只卡皮巴拉凌晨出逃，還有1只至今逍遙在外

佛山電視臺小強熱線 2025-05-01 20:28:00
3 跟貼 3
DeepSeek推薦：能養你一輩子的9個好習慣

洞見 2025-05-03 22:24:06
65 跟貼 65
凌晨集體"越獄"! 3號蹲守到30號…仍未全部抓回! 網友:拒絕營業

魯中晨報 2025-05-02 08:56:35
9 跟貼 9
??《巴拉吉預言》書評：如何用技術對抗死亡、謊言與虛無？

教師吧 2025-05-04 11:27:35
0 跟貼 0
兩個信封，一個選擇，看穿它的人不超過1%

質子教授 2025-05-02 21:15:50
11 跟貼 11
高頻交易中的市場微觀結構與算法博弈

略財經 2025-05-05 01:20:23
0 跟貼 0
豆瓣9.5黑暗童話巔峰作！推理迷苦等6年!

賣書狂魔熊貓君 2025-05-02 18:35:15
6 跟貼 6
76歲老人0圖紙0鐵釘造出1200平米木樓數十年屹立不倒

瀟湘晨報 2025-05-04 13:01:57
4663 跟貼 4663
普京外交策略：大鵝在印巴沖突中的平衡與信號傳遞

期盼美好明天 2025-05-03 07:46:19
0 跟貼 0
如何提升量化策略的魯棒性

略財經 2025-05-04 04:16:55
0 跟貼 0
五一假期折多山自駕車集體掀蓋散熱，車主靠邊淡定觀景

青夢白話 2025-05-04 16:09:34
4605 跟貼 4605
一只意外掉落的玩偶卻讓商場的轉角開出了小花網友：也許驚喜就在你身邊

蓬勃資訊 2025-05-04 08:30:01
1 跟貼 1
不孕不育與納米機器人

零度星系 2025-05-03 19:33:33
1 跟貼 1
小伙喬遷定制門牌，小小的玩偶，儀式感滿滿！

爆笑論 2025-05-03 14:11:52
1 跟貼 1
男人為了滿足自己，竟把機器人當做女友，不料機器人突然覺醒

海韻影視劇 2025-05-02 18:02:59
1 跟貼 1
大決戰：18集｜韓先楚大膽計劃與陳誠謹慎策略的較量！

鈺淇劇場 2025-05-04 17:19:19
3 跟貼 3
普京這一手敘利亞布局策略，堪稱棋高一著！大鵝憑啥讓美國吃癟

領略快樂真諦 2025-05-04 08:03:14
0 跟貼 0
女子路上偶遇機器人熱心打招，機器人暖心回應互動

生活比個耶 2025-05-04 13:42:11
0 跟貼 0

手機 / 數碼

房產 / 家居

豆包1.5深度思考模型發布：暴砍參數量，能看圖思考，數學編程超DeepSeek-R1

巴菲特：理性看待AI炒作 耐心是關鍵

美媒：中美貿易戰若再持續幾周 美供應商將做艱難決定

美媒：中美貿易戰若再持續幾周 美供應商將做艱難決定

首冠到手!凱恩秒慶祝 德甲官方:不負追光之人

55歲王菲跟“李亞鵬時期”完全不同！

一個時代的結束！巴菲特年底將卸任

小米SU7大優惠！5月限時購車權益送輔助駕駛

態度原創

黑白紋理 簡約低調空間

唇皰疹和口腔潰瘍是"同伙"嗎？

不招人，一些企業卻擠進校招會，這背后到底是因為什么

多年來首次設計重構：微軟13英寸Surface Laptop曝光，5月6日發布

曝蘋果正在開發20周年紀念版iPhone

巴菲特：理性看待AI炒作耐心是關鍵

美媒：中美貿易戰若再持續幾周美供應商將做艱難決定

美媒：中美貿易戰若再持續幾周美供應商將做艱難決定

首冠到手!凱恩秒慶祝德甲官方:不負追光之人

黑白紋理簡約低調空間