首個(gè)高考數(shù)學(xué)滿分AI誕生！海淀名師審大題，給出驚艷超高分

2025-06-17 13:43:56　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：Aeneas 犀牛

【新智元導(dǎo)讀】高考數(shù)學(xué)滿分AI出現(xiàn)了！豆包愛學(xué)App首次公開挑戰(zhàn)高考數(shù)學(xué)全國卷，由6位資深名師嚴(yán)格把關(guān)，主觀題步驟全打分，竟然斬獲Ⅰ卷144分、Ⅱ卷150分滿分戰(zhàn)績。這個(gè)驚艷的成績或許預(yù)示著，AI教育真要變天了。

大模型來做高考數(shù)學(xué)真題，最近可是太火了。

不過對于各個(gè)版本的AI解題評分是否公正，坊間一直頗多爭議。

我們突然發(fā)現(xiàn)，一位高考數(shù)學(xué)滿分選手出現(xiàn)！

我們在豆包愛學(xué)的官方賬號看到，考試結(jié)束后，豆包愛學(xué)第一時(shí)間將結(jié)果放到了網(wǎng)上。

豆包愛學(xué)App的AI深度解題能力（即豆包大模型教育版），直接獲得了高考數(shù)學(xué)全國Ⅰ卷144分、全國Ⅱ卷150分滿分。

而且它的得分，是由六位平均教齡超10年的一線資深數(shù)學(xué)教師給出的，甚至對解答題的步驟進(jìn)行了嚴(yán)格打分，可以說，這個(gè)分?jǐn)?shù)十分有含金量了。

2025高考數(shù)學(xué)卷

豆包大模型教育版接近滿分！

下面我們來看看，豆包大模型教育版對于2025高考數(shù)學(xué)全國卷中部分選擇題、填空題、問答題的解答情況。

先來看一道讓一眾大模型聞風(fēng)喪膽的選擇題，全國Ⅰ卷第6題。

這道題AI之所以很難做對，是因?yàn)樗扔形淖?、又有圖表、圖片。

不僅需要模型的多模態(tài)能力，還要有很好的信息整合能力。

尤其是模型還要理解圖中向量的方向，然后進(jìn)行推理計(jì)算，這對模型極其困難。

來看看豆包大模型教育版的表現(xiàn)。

它的回答有兩點(diǎn)讓人印象深刻，甚至驚艷。

首先，它在思考過程中消耗的token數(shù)非常少，比行業(yè)里其他大模型都要精簡很多。盡管在整個(gè)過程中檢查了3次。

經(jīng)常用推理模型的同學(xué)肯定都見過那些長到可以讓人發(fā)狂的思考過程。

其次是它的公式渲染能力，基礎(chǔ)的絕對值、根號這些就不說了，它連向量上邊的小箭頭都渲染的很好了。

讀起來專業(yè)又舒服。

最后簡單說下它的解題過程，流暢又有邏輯，簡潔而準(zhǔn)確。

說完了最讓模型撓頭的題，再來看試卷中最難的題——壓軸題。

這是一道導(dǎo)數(shù)計(jì)算證明題，使用的三角函數(shù)。

我們來看豆包大模型教育版是如何應(yīng)對的。

思路同樣清晰。

這個(gè)過程中，模型還有幾個(gè)有趣的表現(xiàn)。

例如，拿到簡化結(jié)果后，它會(huì)驚訝。

對變量替換法、反證法這些常用的方法，掌握得非常嫻熟。

還有就是可以快速鎖定問題的本質(zhì)。

完整思考過程及結(jié)果如下。

接下來，看一下模型對于II卷的解題結(jié)果。

對于幾道選擇題，模型是手拿把掐、不在話下，解題過程非常絲滑。

單項(xiàng)選擇題1：

這道題涉及到實(shí)數(shù)和虛數(shù)的知識點(diǎn)，模型在分布推理后，得到了正確答案A。

單項(xiàng)選擇題2：

這道選擇題，應(yīng)用到了余弦定理。

模型在思考過程中，找出解題關(guān)鍵——需要用余弦定理求角A，最終得出了正確答案A。

單項(xiàng)選擇題3：

在解題過程中，模型利用了拋物線的定義和直線方程的性質(zhì)，最后得出正確答案C。

多項(xiàng)選擇題，模型也是不會(huì)放過一個(gè)正確答案。

多項(xiàng)選擇題4：

這道題涉及到知識點(diǎn)是等比數(shù)列，模型通過構(gòu)建了一個(gè)關(guān)于首項(xiàng)a_1和公比q的方程組來求解，最終得出了正確選項(xiàng)A、D。

多項(xiàng)選擇題5：

這道題涉及到了雙曲線的知識點(diǎn)，模型通過求解以F_1F_2為直徑的圓與漸近線的交點(diǎn)，再推導(dǎo)a、b的關(guān)系，利用向量點(diǎn)積公式，得出了A、C、D三個(gè)正確答案。

對于填空題，模型的求解過程也是十分絲滑。

填空題1：

在這道填空題中，模型推理出要計(jì)算結(jié)果，就需要讓鐵球滿足「與圓柱底面、頂面、側(cè)面相切，且兩球自身相切」的極限條件，最終通過計(jì)算和驗(yàn)證，得出正確答案5/2cm。

然后到了真刀真槍測實(shí)力的大題環(huán)節(jié)。

解答題1：

對于這道幾何題，模型首先將直線A’B的方向向量與屏幕CD’F的法向量進(jìn)行點(diǎn)積運(yùn)算，通過結(jié)果為0，成功證明直線A’B平行于平面CD’F。

隨后在第二步中，通過轉(zhuǎn)向二面角計(jì)算、求解第一和第二個(gè)法向量、計(jì)算法向量夾角的余弦，最終得出了正確的正弦值。

解答題2：

這道大題既包括計(jì)算，還包括證明，難度不小。

模型通過求導(dǎo)，分析f’(x)在(0,+∞)的符號，證明了存在唯一零點(diǎn)。隨后通過分析g’(t)的正負(fù)確定了g(t)單調(diào)性，進(jìn)而并完成了大小比較，三個(gè)問題全部給出了正確解答。

解答題3：

對于這道概率題，模型首先計(jì)算出了p_3，p_4的概率，然后得到關(guān)于p和q的簡潔關(guān)系式，得出了p正確的值。

到了最后一問的證明，題目難度已經(jīng)飆到極高。

為了成功完成證明，模型引入了一個(gè)輔助數(shù)列，這樣就將需要證明的不等式轉(zhuǎn)化為了分析新數(shù)列項(xiàng)與項(xiàng)之間的差值。

經(jīng)過嚴(yán)謹(jǐn)?shù)耐评砗?，最終它成功完成了證明。

看完這些解題過程，可能你會(huì)疑問：這么好的成績，真的是全靠模型做出來的嗎？會(huì)不會(huì)是每次都取最好成績，才有的這個(gè)結(jié)果？

看完下面這個(gè)過程，你就可以打消顧慮了——豆包大模型教育版的數(shù)學(xué)解題能力，就是這么牛！

評分過程超嚴(yán)，絕不放水

5次都答對，才算過關(guān)

經(jīng)常使用AI做題的小伙伴肯定都有體會(huì)，那就是現(xiàn)階段的AI答題并不穩(wěn)定。

有些模型很不穩(wěn)定，簡單些的還好，遇到難一點(diǎn)的題目，需要試好幾次才能得到一個(gè)滿意的答復(fù)。

如果模型性能不行就更別提了，徹底擺爛，答不對不說，還會(huì)時(shí)常一本正經(jīng)地胡言亂語。

這就使得AI解題看上去不那么實(shí)用：你很難判斷它首次給出的答案是不是對的——我如果知道正確答案，還請AI干嘛呢？

所以，AI答題正確的穩(wěn)定性至關(guān)重要。

為了避免隨機(jī)性，根據(jù)公布的結(jié)果看，此次豆包愛學(xué)測了五次，同時(shí)前五遍結(jié)果發(fā)到了HuggingFace上。

可以看出，每道題分別列出了思考過程與輸出答案，只有每次都答對才算過關(guān)。

要求相當(dāng)嚴(yán)苛，結(jié)果相對公正。

這也說明了豆包大模型教育版解題穩(wěn)定性很高。

6大資深數(shù)學(xué)名師把關(guān)，AI滿分交卷

不僅，如此，豆包大模型教育版此次答題的評分過程，還經(jīng)過了不少名師把關(guān)！

為了得到足夠嚴(yán)謹(jǐn)?shù)臏y評結(jié)果，豆包愛學(xué)App特意邀請了6位平均教齡超10年、畢業(yè)于知名高校的一線教學(xué)、閱卷崗位的資深數(shù)學(xué)教師，對作答結(jié)果進(jìn)行了詳細(xì)的交叉評分。

最終評分結(jié)果為——全國Ⅰ卷：144分、全國Ⅱ卷：150分（滿分）。

這一結(jié)果充分證明了豆包大模型教育版在解題結(jié)果方面出色的能力，能在幾位名師手里拿到滿分，更是說明了模型在解題過程中推理邏輯縝密、步驟精準(zhǔn)，符合評分細(xì)則。

而在測評過程中，這些資深數(shù)學(xué)老師們也發(fā)現(xiàn)了豆包大模型教育版的一些有意思的細(xì)節(jié)。

比如，趙武俊老師發(fā)現(xiàn)，模型再在解Ⅰ卷最后一題的最后一問時(shí)，推理的過程「特別像考生作答的這種感覺」。

所以，看模型的解題思考過程就好像是在看自己的解答過程一樣，十分有啟發(fā)。

李想老師則給出了更加詳細(xì)的使用建議。

例如，他建議利用模型解答立體幾何部分的題目時(shí)，可以讓AI給出常規(guī)定義法和空間向量法兩種方法。

這樣，就可以直觀地比較出到底哪種方法更加適合自己，而且也更加貼近高中的教學(xué)內(nèi)容。

當(dāng)然，在測評過程中名師們也發(fā)現(xiàn)了模型現(xiàn)在在解題過程中存在的一些問題。

比如，曾多次參與高考集中閱卷的楊春暉老師就發(fā)現(xiàn)，部分解題過程可能會(huì)出現(xiàn)高中未學(xué)的技巧與公式。

韓曉樂老師也發(fā)現(xiàn)了數(shù)字之間的乘法符號使用點(diǎn)乘、點(diǎn)坐標(biāo)結(jié)果未化簡等問題。

當(dāng)然，上面出現(xiàn)的這些問題也不是沒有解決辦法。

比如，我們可以要求模型解題時(shí)使用高中的知識，解題步驟中即時(shí)化簡等。

在經(jīng)過深入的體驗(yàn)與測試后，李偉景老師對豆包大模型教育版給出了高度評價(jià)，總結(jié)道：豆包大模型教育版無論是「對教師授課還是學(xué)生自學(xué)都非常有用，未來將有很大幫助。」

對于教師來說，豆包大模型教育版就像一位得力的教學(xué)助手。

它能夠快速生成多樣化的教學(xué)思路，涵蓋課程設(shè)計(jì)、課堂互動(dòng)到知識點(diǎn)講解等方方面面，幫助老師更高效地備課和授課。

無論是需要梳理復(fù)雜的知識框架，還是設(shè)計(jì)生動(dòng)有趣的教學(xué)活動(dòng)，模型都能提供全面且實(shí)用的建議，讓課堂更加生動(dòng)、條理清晰，大大提升教學(xué)效果。

對于學(xué)生，這款模型同樣是一個(gè)強(qiáng)大的學(xué)習(xí)伙伴。

它能夠根據(jù)學(xué)生的需求，清晰地拆解題目，提供詳細(xì)且易懂的解題步驟，幫助學(xué)生快速掌握解題方法和核心知識點(diǎn)。

無論是數(shù)學(xué)的邏輯推導(dǎo)、語文作文的分析，還是其他學(xué)科的疑難問題，豆包大模型教育版都能以通俗易懂的方式引導(dǎo)學(xué)生逐步攻克難點(diǎn)，從而有效提高學(xué)習(xí)效率和考試成績。

堪稱學(xué)習(xí)神器！

AI教育新形態(tài)來了

在親自實(shí)測了豆包大模型教育版的解題過程后，小編最強(qiáng)烈的感受就是——

它的思考過程完全透明，每一步的解析都很明確，不僅能拿高分，還能講明白。這樣，就能讓學(xué)生獲得高質(zhì)量的一對一講解。

從此，學(xué)數(shù)學(xué)可以不再只靠「刷題」，而是通過大模型的幫忙，養(yǎng)成嚴(yán)謹(jǐn)?shù)耐评砟芰?，和直覺式的解題思路。

在AI做題和講解的幫助下，學(xué)生可以給自己來一個(gè)「自我診斷」，搞清楚自己是錯(cuò)在哪里，是計(jì)算失誤、邏輯混亂還是審題不清？

在教育資源不均的地區(qū)，弱勢學(xué)生也能更公平地獲得好「老師」。

總之，豆包大模型教育版這位「高考數(shù)學(xué)」?jié)M分選手的驚艷表現(xiàn)，不僅展示了目前AI大模型做題的實(shí)力，更是對未來教育模式的一次前瞻性預(yù)演。

AI教育，未來可期！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.