新智元報(bào)道
編輯:Aeneas 犀牛
【新智元導(dǎo)讀】高考數(shù)學(xué)滿分AI出現(xiàn)了!豆包愛學(xué)App首次公開挑戰(zhàn)高考數(shù)學(xué)全國卷,由6位資深名師嚴(yán)格把關(guān),主觀題步驟全打分,竟然斬獲Ⅰ卷144分、Ⅱ卷150分滿分戰(zhàn)績。這個(gè)驚艷的成績或許預(yù)示著,AI教育真要變天了。
大模型來做高考數(shù)學(xué)真題,最近可是太火了。
不過對于各個(gè)版本的AI解題評分是否公正,坊間一直頗多爭議。
我們突然發(fā)現(xiàn),一位高考數(shù)學(xué)滿分選手出現(xiàn)!
我們在豆包愛學(xué)的官方賬號看到,考試結(jié)束后,豆包愛學(xué)第一時(shí)間將結(jié)果放到了網(wǎng)上。
豆包愛學(xué)App的AI深度解題能力(即豆包大模型教育版),直接獲得了高考數(shù)學(xué)全國Ⅰ卷144分、全國Ⅱ卷150分滿分。
而且它的得分,是由六位平均教齡超10年的一線資深數(shù)學(xué)教師給出的,甚至對解答題的步驟進(jìn)行了嚴(yán)格打分,可以說,這個(gè)分?jǐn)?shù)十分有含金量了。
2025高考數(shù)學(xué)卷
豆包大模型教育版接近滿分!
下面我們來看看,豆包大模型教育版對于2025高考數(shù)學(xué)全國卷中部分選擇題、填空題、問答題的解答情況。
先來看一道讓一眾大模型聞風(fēng)喪膽的選擇題,全國Ⅰ卷第6題。
這道題AI之所以很難做對,是因?yàn)樗扔形淖?、又有圖表、圖片。
不僅需要模型的多模態(tài)能力,還要有很好的信息整合能力。
尤其是模型還要理解圖中向量的方向,然后進(jìn)行推理計(jì)算,這對模型極其困難。
來看看豆包大模型教育版的表現(xiàn)。
它的回答有兩點(diǎn)讓人印象深刻,甚至驚艷。
首先,它在思考過程中消耗的token數(shù)非常少,比行業(yè)里其他大模型都要精簡很多。盡管在整個(gè)過程中檢查了3次。
經(jīng)常用推理模型的同學(xué)肯定都見過那些長到可以讓人發(fā)狂的思考過程。
其次是它的公式渲染能力,基礎(chǔ)的絕對值、根號這些就不說了,它連向量上邊的小箭頭都渲染的很好了。
讀起來專業(yè)又舒服。
最后簡單說下它的解題過程,流暢又有邏輯,簡潔而準(zhǔn)確。
說完了最讓模型撓頭的題,再來看試卷中最難的題——壓軸題。
這是一道導(dǎo)數(shù)計(jì)算證明題,使用的三角函數(shù)。
我們來看豆包大模型教育版是如何應(yīng)對的。
思路同樣清晰。
這個(gè)過程中,模型還有幾個(gè)有趣的表現(xiàn)。
例如,拿到簡化結(jié)果后,它會(huì)驚訝。
對變量替換法、反證法這些常用的方法,掌握得非常嫻熟。
還有就是可以快速鎖定問題的本質(zhì)。
完整思考過程及結(jié)果如下。
接下來,看一下模型對于II卷的解題結(jié)果。
對于幾道選擇題,模型是手拿把掐、不在話下,解題過程非常絲滑。
單項(xiàng)選擇題1:
這道題涉及到實(shí)數(shù)和虛數(shù)的知識點(diǎn),模型在分布推理后,得到了正確答案A。
單項(xiàng)選擇題2:
這道選擇題,應(yīng)用到了余弦定理。
模型在思考過程中,找出解題關(guān)鍵——需要用余弦定理求角A,最終得出了正確答案A。
單項(xiàng)選擇題3:
在解題過程中,模型利用了拋物線的定義和直線方程的性質(zhì),最后得出正確答案C。
多項(xiàng)選擇題,模型也是不會(huì)放過一個(gè)正確答案。
多項(xiàng)選擇題4:
這道題涉及到知識點(diǎn)是等比數(shù)列,模型通過構(gòu)建了一個(gè)關(guān)于首項(xiàng)a_1和公比q的方程組來求解,最終得出了正確選項(xiàng)A、D。
多項(xiàng)選擇題5:
這道題涉及到了雙曲線的知識點(diǎn),模型通過求解以F_1F_2為直徑的圓與漸近線的交點(diǎn),再推導(dǎo)a、b的關(guān)系,利用向量點(diǎn)積公式,得出了A、C、D三個(gè)正確答案。
對于填空題,模型的求解過程也是十分絲滑。
填空題1:
在這道填空題中,模型推理出要計(jì)算結(jié)果,就需要讓鐵球滿足「與圓柱底面、頂面、側(cè)面相切,且兩球自身相切」的極限條件,最終通過計(jì)算和驗(yàn)證,得出正確答案5/2cm。
然后到了真刀真槍測實(shí)力的大題環(huán)節(jié)。
解答題1:
對于這道幾何題,模型首先將直線A’B的方向向量與屏幕CD’F的法向量進(jìn)行點(diǎn)積運(yùn)算,通過結(jié)果為0,成功證明直線A’B平行于平面CD’F。
隨后在第二步中,通過轉(zhuǎn)向二面角計(jì)算、求解第一和第二個(gè)法向量、計(jì)算法向量夾角的余弦,最終得出了正確的正弦值。
解答題2:
這道大題既包括計(jì)算,還包括證明,難度不小。
模型通過求導(dǎo),分析f’(x)在(0,+∞)的符號,證明了存在唯一零點(diǎn)。隨后通過分析g’(t)的正負(fù)確定了g(t)單調(diào)性,進(jìn)而并完成了大小比較,三個(gè)問題全部給出了正確解答。
解答題3:
對于這道概率題,模型首先計(jì)算出了p_3,p_4的概率,然后得到關(guān)于p和q的簡潔關(guān)系式,得出了p正確的值。
到了最后一問的證明,題目難度已經(jīng)飆到極高。
為了成功完成證明,模型引入了一個(gè)輔助數(shù)列,這樣就將需要證明的不等式轉(zhuǎn)化為了分析新數(shù)列項(xiàng)與項(xiàng)之間的差值。
經(jīng)過嚴(yán)謹(jǐn)?shù)耐评砗?,最終它成功完成了證明。
看完這些解題過程,可能你會(huì)疑問:這么好的成績,真的是全靠模型做出來的嗎?會(huì)不會(huì)是每次都取最好成績,才有的這個(gè)結(jié)果?
看完下面這個(gè)過程,你就可以打消顧慮了——豆包大模型教育版的數(shù)學(xué)解題能力,就是這么牛!
評分過程超嚴(yán),絕不放水
5次都答對,才算過關(guān)
經(jīng)常使用AI做題的小伙伴肯定都有體會(huì),那就是現(xiàn)階段的AI答題并不穩(wěn)定。
有些模型很不穩(wěn)定,簡單些的還好,遇到難一點(diǎn)的題目,需要試好幾次才能得到一個(gè)滿意的答復(fù)。
如果模型性能不行就更別提了,徹底擺爛,答不對不說,還會(huì)時(shí)常一本正經(jīng)地胡言亂語。
這就使得AI解題看上去不那么實(shí)用:你很難判斷它首次給出的答案是不是對的——我如果知道正確答案,還請AI干嘛呢?
所以,AI答題正確的穩(wěn)定性至關(guān)重要。
為了避免隨機(jī)性,根據(jù)公布的結(jié)果看,此次豆包愛學(xué)測了五次,同時(shí)前五遍結(jié)果發(fā)到了HuggingFace上。
可以看出,每道題分別列出了思考過程 與輸出答案 ,只有每次都答對才算過關(guān)。
要求相當(dāng)嚴(yán)苛,結(jié)果相對公正。
這也說明了豆包大模型教育版解題穩(wěn)定性很高。
6大資深數(shù)學(xué)名師把關(guān),AI滿分交卷
不僅,如此,豆包大模型教育版此次答題的評分過程,還經(jīng)過了不少名師把關(guān)!
為了得到足夠嚴(yán)謹(jǐn)?shù)臏y評結(jié)果,豆包愛學(xué)App特意邀請了6位平均教齡超10年、畢業(yè)于知名高校的一線教學(xué)、閱卷崗位的資深數(shù)學(xué)教師,對作答結(jié)果進(jìn)行了詳細(xì)的交叉評分。
最終評分結(jié)果為——全國Ⅰ卷:144分、全國Ⅱ卷:150分(滿分)。
這一結(jié)果充分證明了豆包大模型教育版在解題結(jié)果方面出色的能力,能在幾位名師手里拿到滿分,更是說明了模型在解題過程中推理邏輯縝密、步驟精準(zhǔn),符合評分細(xì)則。
而在測評過程中,這些資深數(shù)學(xué)老師們也發(fā)現(xiàn)了豆包大模型教育版的一些有意思的細(xì)節(jié)。
比如,趙武俊老師發(fā)現(xiàn),模型再在解Ⅰ卷最后一題的最后一問時(shí),推理的過程「特別像考生作答的這種感覺」。
所以,看模型的解題思考過程就好像是在看自己的解答過程一樣,十分有啟發(fā)。
李想老師則給出了更加詳細(xì)的使用建議。
例如,他建議利用模型解答立體幾何部分的題目時(shí),可以讓AI給出常規(guī)定義法和空間向量法兩種方法。
這樣,就可以直觀地比較出到底哪種方法更加適合自己,而且也更加貼近高中的教學(xué)內(nèi)容。
當(dāng)然,在測評過程中名師們也發(fā)現(xiàn)了模型現(xiàn)在在解題過程中存在的一些問題。
比如,曾多次參與高考集中閱卷的楊春暉老師就發(fā)現(xiàn),部分解題過程可能會(huì)出現(xiàn)高中未學(xué)的技巧與公式。
韓曉樂老師也發(fā)現(xiàn)了數(shù)字之間的乘法符號使用點(diǎn)乘、點(diǎn)坐標(biāo)結(jié)果未化簡等問題。
當(dāng)然,上面出現(xiàn)的這些問題也不是沒有解決辦法。
比如,我們可以要求模型解題時(shí)使用高中的知識,解題步驟中即時(shí)化簡等。
在經(jīng)過深入的體驗(yàn)與測試后,李偉景老師對豆包大模型教育版給出了高度評價(jià),總結(jié)道:豆包大模型教育版無論是「對教師授課還是學(xué)生自學(xué)都非常有用,未來將有很大幫助。」
對于教師來說,豆包大模型教育版就像一位得力的教學(xué)助手。
它能夠快速生成多樣化的教學(xué)思路,涵蓋課程設(shè)計(jì)、課堂互動(dòng)到知識點(diǎn)講解等方方面面,幫助老師更高效地備課和授課。
無論是需要梳理復(fù)雜的知識框架,還是設(shè)計(jì)生動(dòng)有趣的教學(xué)活動(dòng),模型都能提供全面且實(shí)用的建議,讓課堂更加生動(dòng)、條理清晰,大大提升教學(xué)效果。
對于學(xué)生,這款模型同樣是一個(gè)強(qiáng)大的學(xué)習(xí)伙伴。
它能夠根據(jù)學(xué)生的需求,清晰地拆解題目,提供詳細(xì)且易懂的解題步驟,幫助學(xué)生快速掌握解題方法和核心知識點(diǎn)。
無論是數(shù)學(xué)的邏輯推導(dǎo)、語文作文的分析,還是其他學(xué)科的疑難問題,豆包大模型教育版都能以通俗易懂的方式引導(dǎo)學(xué)生逐步攻克難點(diǎn),從而有效提高學(xué)習(xí)效率和考試成績。
堪稱學(xué)習(xí)神器!
AI教育新形態(tài)來了
在親自實(shí)測了豆包大模型教育版的解題過程后,小編最強(qiáng)烈的感受就是——
它的思考過程完全透明,每一步的解析都很明確,不僅能拿高分,還能講明白。這樣,就能讓學(xué)生獲得高質(zhì)量的一對一講解。
從此,學(xué)數(shù)學(xué)可以不再只靠「刷題」,而是通過大模型的幫忙,養(yǎng)成嚴(yán)謹(jǐn)?shù)耐评砟芰?,和直覺式的解題思路。
在AI做題和講解的幫助下,學(xué)生可以給自己來一個(gè)「自我診斷」,搞清楚自己是錯(cuò)在哪里,是計(jì)算失誤、邏輯混亂還是審題不清?
在教育資源不均的地區(qū),弱勢學(xué)生也能更公平地獲得好「老師」。
總之,豆包大模型教育版這位「高考數(shù)學(xué)」?jié)M分選手的驚艷表現(xiàn),不僅展示了目前AI大模型做題的實(shí)力,更是對未來教育模式的一次前瞻性預(yù)演。
AI教育,未來可期!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.