今天是多地高考分?jǐn)?shù)線公布的日子,那如果讓 AI 去參加高考,它能考上哪所大學(xué)?
字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)今天公布了最新大模型 Seed1.6-Thinking 的高考成績(jī)單。
據(jù)悉,整個(gè)測(cè)試中,團(tuán)隊(duì)并未引入 prompting engineering(提示詞工程)來(lái)提升模型效果,而是直接使用今年山東高考試題(題目源自網(wǎng)絡(luò))進(jìn)行模擬考試,總分共 750 分。
考試科目設(shè)置如下:
·語(yǔ)數(shù)外使用新課標(biāo)全國(guó)Ⅰ卷
·政史地/物化生使用山東省自主命題
·客觀題:機(jī)器打分+人工質(zhì)檢
·主觀題:由兩位有聯(lián)考判卷經(jīng)驗(yàn)的重點(diǎn)高中老師匿名打分(還做了多輪復(fù)審)
·DeepSeek R1 輸入為題目文本,其余模型為題目文本+題目截圖
·默認(rèn)所有模型在英語(yǔ)聽(tīng)力上均取得滿分。
本次測(cè)試還引入多款主流模型作為對(duì)比對(duì)象,包括 OpenAI o3 high、Gemini 2.5 Pro、Claude Sonnet 4、DeepSeek R1 0528。
成績(jī)單顯示,Seed1.6-Thinking 的文科成績(jī)?yōu)?683 分(語(yǔ)數(shù)外 + 文綜),在五款模型中排名第一。
理科成績(jī)方面,Gemini 2.5 Pro-0605 以 655 分排名第一,而豆包 Seed1.6-Thinking 排名第二,理科成績(jī)?yōu)?648 分(語(yǔ)數(shù)外 + 理綜)。
附上評(píng)分細(xì)則:
https://bytedance.sg.larkoffice.com/sheets/QgoFs7RBjhnrUXtCBsYl0Jg2gmg
其中,地理和歷史兩科表現(xiàn)尤為亮眼,理解與推理能力突出,化學(xué)以及生物由于原始題圖模糊,失分較多,后續(xù)使用高清題圖時(shí),采用圖文交織的方式,生化兩科總分還能再提升近 30 分,理綜達(dá)到 676 分。
對(duì)照最新公布的山東高考分?jǐn)?shù)線,特殊類(lèi)型招生控制線為 521 分,普通類(lèi)一段線為 441 分,二段線為 150 分。
以此標(biāo)準(zhǔn)來(lái)看,Seed1.6-Thinking 不僅輕松超過(guò)本科線,甚至已超過(guò)大部分 985 高校往年錄取線,可以收拾收拾,準(zhǔn)備填完志愿上大學(xué)了。
附 Seed1.6-Thinking 體驗(yàn)地址:
https://www.volcengine.com/experience/ark?model=doubao-seed-1-6-250615
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.