今天是多地高考分數線公布的日子,那如果讓 AI 去參加高考,它能考上哪所大學?
字節跳動 Seed 團隊今天公布了最新大模型 Seed1.6-Thinking 的高考成績單。
據悉,整個測試中,團隊并未引入 prompting engineering(提示詞工程)來提升模型效果,而是直接使用今年山東高考試題(題目源自網絡)進行模擬考試,總分共 750 分。
考試科目設置如下:
·語數外使用新課標全國Ⅰ卷
·政史地/物化生使用山東省自主命題
·客觀題:機器打分+人工質檢
·主觀題:由兩位有聯考判卷經驗的重點高中老師匿名打分(還做了多輪復審)
·DeepSeek R1 輸入為題目文本,其余模型為題目文本+題目截圖
·默認所有模型在英語聽力上均取得滿分。
本次測試還引入多款主流模型作為對比對象,包括 OpenAI o3 high、Gemini 2.5 Pro、Claude Sonnet 4、DeepSeek R1 0528。
成績單顯示,Seed1.6-Thinking 的文科成績為 683 分(語數外 + 文綜),在五款模型中排名第一。
理科成績方面,Gemini 2.5 Pro-0605 以 655 分排名第一,而豆包 Seed1.6-Thinking 排名第二,理科成績為 648 分(語數外 + 理綜)。
附上評分細則:
https://bytedance.sg.larkoffice.com/sheets/QgoFs7RBjhnrUXtCBsYl0Jg2gmg
其中,地理和歷史兩科表現尤為亮眼,理解與推理能力突出,化學以及生物由于原始題圖模糊,失分較多,后續使用高清題圖時,采用圖文交織的方式,生化兩科總分還能再提升近 30 分,理綜達到 676 分。
對照最新公布的山東高考分數線,特殊類型招生控制線為 521 分,普通類一段線為 441 分,二段線為 150 分。
以此標準來看,Seed1.6-Thinking 不僅輕松超過本科線,甚至已超過大部分 985 高校往年錄取線,可以收拾收拾,準備填完志愿上大學了。
附 Seed1.6-Thinking 體驗地址:
https://www.volcengine.com/experience/ark?model=doubao-seed-1-6-250615
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.