網易首頁 > 網易號 > 正文申請入駐

最新一期權威大模型榜單：豆包1.5、商湯日日新V6并列國內第一

2025-05-30 16:19:59　來源: 量子位

四川舉報

分享至

5月28日，權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5月報告》全新出爐！

豆包1.5·深度思考模型（Doubao-1.5-thinking-pro）和商湯日日新 V6多模態模型（SenseNova-V6 Reasoner）共同摘得金牌，超越Gemini 2.5 Flash Preview，在國內大模型第一梯隊領跑。

位居第二梯隊的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

來自SuperCLUE

報告指出，國內外第一梯隊大模型在中文領域的通用能力差距正在縮小。在國產大模型中，
Doubao-1.5-thinking-pro-205415、SenseNova V6 Reasoner表現最為亮眼。國內推理模型競爭格局初露端倪。

SuperCLUE是行業權威的通用大模型的綜合性測評基準。本次2025年5月報告聚焦通用能力測評，涵蓋數學推理、科學推理、代碼生成、智能體Agent、精確指令遵循、文本理解與創作六大任務，總量為1579道多輪簡答題。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

卸載某音后，最震撼的事發生了！

互聯網思維 2025-05-10 23:35:19
18209 跟貼 18209
微軟再放LLM量化大招！原生4bit量化，成本暴減，性能幾乎0損失

新智元 2025-06-01 12:30:01
1 跟貼 1

擴散語言模型九倍推理加速！KV Cache并非自回歸模型專屬

量子位 2025-05-27 17:02:02
0 跟貼 0

Claude 4 核心成員：2027 年，AI 將自動化幾乎所有白領工作 | 萬字對談

愛范兒 2025-05-31 12:03:16
17 跟貼 17
如果俄羅斯倒了，世界格局將會怎樣？

魏叔胡侃 2025-05-30 14:53:54
277 跟貼 277

如廁自由？高分的機器人還是高分的人？

弓立軍 2025-05-31 12:16:34
1 跟貼 1

北京農業人工智能與機器人研究院揭牌

經濟觀察報 2025-06-02 09:29:03
0 跟貼 0
AI說書媲美真人！豆包語音大模型升級長上下文理解

量子位 2025-02-26 15:23:35
19 跟貼 19

具身智能機器人“飛燕”在商湯技術交流日展區與展示實時視覺能力

智東西 2025-04-11 14:27:24
0 跟貼 0
牛彈琴：烏最大膽無人機攻擊預示著人類一個可怕未來

映象網 2025-06-02 08:41:18
27414 跟貼 27414
“人工智能+腦科學”再添拼復旦兒科啟動我國首個兒童腦健康大模型應用

上觀新聞 2025-06-01 19:45:25
1 跟貼 1
OpenAI似乎步子邁太大了

虎嗅APP 2025-06-01 02:55:07
33 跟貼 33
大模型應用落地場景從簡單高容錯向復雜低容錯延伸

量子位 2025-04-22 16:21:27
0 跟貼 0
上古羌人是哪來的？為何商朝抓到羌人都要對其處刑？考古發現答案

縱古貫今 2025-05-29 09:15:12
1 跟貼 1
我遼寧人，吃過南方的肉粽后，終于明白，為啥粽子要吃咸的了！

神牛 2025-06-02 09:02:10
0 跟貼 0
豆包1.5·深度思考模型上線(2)

機器之心Pro 2025-04-17 19:53:58
0 跟貼 0
印媒說印度是改變世界格局的第三梯隊

HYN永 2025-05-31 17:13:49
9 跟貼 9
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
沒想到有一天機器人也能劃上龍船了！網友：一路火花帶閃電，沒人敢搶第一名

城市大眼睛 2025-05-30 18:26:27
0 跟貼 0
一家三口回娘家，不料媽媽開口態度分明，男子做法彰顯格局！

湯細目生活 2025-06-01 09:38:14
0 跟貼 0
世界模型新成果！視頻實時生成交互，速度達40毫秒/幀

量子位 2025-05-30 18:21:45
0 跟貼 0
具身智能機器人落地前，還有這些難關要過

36氪 2025-06-02 09:37:23
0 跟貼 0
為了讓電腦上的數學公式更好看，這件事折騰了快50年

量子位 2025-05-30 11:32:17
17 跟貼 17
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
微軟用AI改Bug翻車，全球程序員圍觀嘲笑

量子位 2025-05-31 12:36:26
0 跟貼 0
機器人墻體噴繪

制造科技 2025-06-01 11:33:15
0 跟貼 0
為什么對于傳統車企來說，軟件定義汽車就這么難？

鄭誼 2025-05-30 16:42:45
1 跟貼 1
雨中逛安徽博物院。夏桀奔南巢，商湯建酒池肉林，這是所熟知

斑斕的顏色 2025-05-31 20:02:22
0 跟貼 0
特朗普如何通過鋼鐵關稅和穩定幣重塑全球金融格局

秋之潔 2025-06-02 01:59:53
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
1 跟貼 1
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
LeCun新作反殺AGI派！AI連「鳥」都搞不懂，拿什么超越人類？

新智元 2025-06-02 09:31:14
0 跟貼 0
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
硅谷今夜集體失眠！互聯網女皇340頁AI報告猛料刷屏，大佬熬夜頭禿

新智元 2025-06-02 13:38:33
0 跟貼 0
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
又是一次蟬聯，零跑拿下新勢力銷冠三連，距離年銷50萬目標更近了

涼羽亭 2025-06-01 17:01:23
42 跟貼 42

手機 / 數碼

房產 / 家居

最新一期權威大模型榜單：豆包1.5、商湯日日新V6并列國內第一

新造車5月再洗牌：問界回前三，小米守第五

女子花460萬買大平層 買第二套時發現土地使用權剩47年

女子花460萬買大平層 買第二套時發現土地使用權剩47年

傲了一輩子的恩里克，心中永遠住著一個小天使

章子怡深夜曬娃，兒女正面照曝光

美稱中方違反經貿會談共識 商務部駁斥

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

2024智慧家長家教好故事展播（二十二）

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

今年最流行的10條裙子，誰穿誰美！

孩子羅圈腿怎么辦？小兒骨科醫生來幫你！

又一人間胸器！《劍星》Shift Up公布新作主視覺圖

女子花460萬買大平層買第二套時發現土地使用權剩47年

女子花460萬買大平層買第二套時發現土地使用權剩47年

美稱中方違反經貿會談共識商務部駁斥

吉利汽車5月銷量23.52萬輛同比增長46%