日前,字節(jié)跳動Seed團(tuán)隊(duì)公布2025高考全科測試結(jié)果。該測試采用全國新一卷和山東省自主命題,豆包Seed1.6-Thinking模型的文科和理科成績分別達(dá)到683分和648分。在同期測試的國內(nèi)外5款頂級模型中,豆包文科成績獲最高分,理科僅次于谷歌Gemini2.5Pro,后者成績?yōu)?55分。
測試結(jié)果顯示,豆包的語文、英語、物理、歷史、地理、政治六門學(xué)科獲最高分,數(shù)學(xué)成績也超過140分;DeepSeekR1獲得數(shù)學(xué)最高分145分;Gemini2.5Pro以82分獲得化學(xué)最高分,并與OpenAIo3一起獲得生物最高分,成績?yōu)?7分。
Seed團(tuán)隊(duì)表示,首次測試時(shí)使用的網(wǎng)絡(luò)版考卷清晰度較低,各大模型在化學(xué)、生物兩門非常依賴圖像的考試中丟分較多。該團(tuán)隊(duì)在獲得更高清版本的高考試題圖片后,采用圖文交織的方式對化學(xué)和生物重新進(jìn)行測試,發(fā)現(xiàn)豆包模型在這兩科上能夠提升近30分,理科總成績可達(dá)到676分,驗(yàn)證了全模態(tài)推理可以更大程度激發(fā)模型的潛力。
據(jù)悉,山東省高考為“3+3”形式,語數(shù)英為基礎(chǔ)學(xué)科,自選三門科目采用等級分?jǐn)?shù)轉(zhuǎn)換成績。據(jù)山東當(dāng)?shù)刭Y深高中老師分析,豆包賦分成績組合,最高可達(dá)690分左右,參照2025年山東地區(qū)一分一段表,排名約在前80位,有望考上清華、北大等頂尖學(xué)府。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.