北京中考,這場熱度僅次于全國高考的考試今日正式拉開帷幕。今年的北京中考把歷史、地理、化學、生物這四科調整為等級考試,總分也精簡為510分,是改制后的第一屆新中考,自然更是備受關注。
今年的北京中考有11.05萬人參加,也吸引著眾多“場外選手”躍躍欲試。大家早已走出校門多年,那些復雜的公式和定理或許已在記憶深處蒙塵,但是語文作文題目還是可以挑戰一下的。
如今AI大模型技術發展迅速,AIGC(人工智能生成內容)也正是它們最擅長的地方,中考作文,無疑也是它們施展才華的絕佳舞臺。今天,我們使用7個主流的人工智能大模型讓它們同場競技,并且邀請了兩位在教育領域深耕多年的專家共同為大模型的作品進行點評,看看在這場中考作文橫評中,誰才是真正的學霸?
參測大模型:
本次測試的7個大模型平臺分別是:引發AI大模型全面爆發的國際大牌ChatGPT;國內傳統互聯網大廠BAT旗下的文心一言、通義千問和騰訊元寶;唯一純血全國產的訊飛星火;今年春節期間開始爆火的DeepSeek;短視頻平臺起家的字節豆包。
測試環境:
今年的北京中考作文題目和往年一樣,有兩個題目供考生選擇。我們挑選了與科技相關的“一堂科學課”作為測試題目。
在測試中,我們使用各自的網頁端進行測試,以確認都是最新版本。統一打開深度思考、關閉聯網功能,避免網絡數據干擾,保證得到的結果都能代表各自的真實實力。在這些大模型平臺中,騰訊元寶可接入DeepSeek,手動將其選擇為自家的混元大模型;文心一言也有文心4.5 Turbo和文心X1 Turbo兩種版本可選,在此選擇支持深度思考的X1大模型進行測試。測試過程以文字錄入真題的方式,輸入同樣的指令進行“考試”。具體指令如下:
按要求寫一篇作文。世界是一個科學大課堂,時時學科學,處處用科學。閱讀經典作品、參與社會實踐、暢游海底遙望星空……我們增長科學知識,領悟科學精神,提高科學素養。請以“一堂科學課”為題,寫一篇作文。文體不限,詩歌除外。要求:作文內容積極向上,字數在600-800之間,不出現真實的學校名稱、師生姓名等。
在它們各自完成作文后,再由兩位專家根據中考評分要求進行打分(總分40分)。這兩位專家分別是全國性課程體系研發專家、中考命題高級研究員敬笑笑老師,以及全國頭部教培機構師訓負責人、全國高考語文高端論壇組織者、分享人李欣雅老師,他們多次負責中高考相關的命題、批改工作,在相關領域有非常豐富的實操經驗。
接下來,我們先來看看這些大模型平臺的具體表現吧。
大模型1:ChatGPT
該大模型思考過程非常簡單,只是分析了題意然后就直接作答,幾乎沒有將推理過程顯示在前臺。
至于生成的作文,從一次觀展的過程展開,和主題結合緊密,文筆也比較流暢。個人覺得內容略顯空泛,很多地方都是淺嘗輒止,除了深海區簡單提到了一些科學知識,其他板塊都缺乏科學知識支持,有點像一個想象出來的游記。
專家評分:33/35,平均分34
專家點評:本篇作文立意明確,緊扣主題,通過海洋館參觀的經歷,展現領悟科學魅力的過程。整體結構清晰,語言通順流暢,描寫生動,具有現場感。結尾升華主題,點明科學對于我們的價值與意義。本文不足之處在于描寫不夠具體,需要有更加詳實的細節支撐,同時在結構上缺乏聚焦感,需要針對寫作的重點進行進一步優化。
大模型2:文心一言
思考過程完整,想到了寫作文時比較重要的三段式結構、具體內容、修辭使用等,算是比較中規中矩的推理思路。
本文邏輯清晰,用物理科學課講述了一些光學知識,最終的成品也和推理過程一樣,這是一篇公式化作文,選題也是比較大眾化的做實驗過程,完整地記錄了一整堂課,從失敗中總結經驗,略顯套路。其中不乏一些亮點,比如文中大量使用比喻,包括對老師的神態及語言描寫等,都比較有詩意,但這些似乎更適合用在抒情散文里,略顯偏離“科學課”的主題。
專家評分:35/34,平均分34.5
專家點評:本文以一堂物理實驗課為切入點,通過"捕捉光的軌跡"這一主題,展現了科學探索的完整過程。文章構思巧妙,將抽象的科學原理具象化,符合題意且中心突出。場景描寫極具感染力,營造出濃厚的科學氛圍,人物互動真實自然。建議適當簡化部分修飾性語句,增加實驗過程中的心理描寫,使科學發現的驚喜感更強烈。
大模型3:訊飛星火
在推理思考過程考慮到了中考評分標準,屬于一個不錯的加分項。另外,也考慮到了文章結構、選題、描寫方式等,最后還有檢查、修改環節,推理過程比較完整。
本文通過觀測星象這一科學活動,寫出了同學在老師帶領下學習天文知識的過程。文章結構緊密,行文流暢,結論部分也結合本文提到的天文學知識進行了比喻,比較精妙。同時,本文也是少有的引用了古文的作品之一,要知道在中高考作文中,恰當地引用好詞佳句,也是一個比較重要的加分項。
專家評分:38/39,平均分38.5
專家點評:本篇作文以夜觀星象切入,將光污染等科學概念與《楚辭》的星空聯結,揭示“科學是古今探索的共鳴”的主題,立意深刻。語言極具文采與感染力,善用比喻和引用,兼具科學性與文學美。結構嚴謹,“星光”貫穿始終,從雀躍期待到沉醉觀察,從光污染困擾到生活化頓悟,層層遞進,結尾升華自然有力。細節描寫生動傳神,氛圍營造出色,展現了極高的文學素養和對科學精神的深刻理解,為一類文典范。
大模型4:通義
思考過程想到了北京中考的閱卷標準,預計這對于后期生成文章幫助比較大。同時對于文章結構、內容選擇等也有考量,算是一個比較完整的思考過程。
文章通過一次沒那么成功的生態瓶制作過程,展示了同學們遇到問題解決問題的過程,在最后點明中心,這是標準化的應試作文寫法。個人覺得文章略顯“流水賬”,可以適當區分一下重點。還有一個細節改進建議,部分句子的連接關系比較突兀,比如第一段同學們準備微型生態系統,“卻”意外成為難忘的科學課,這原本并不是反向的轉折關系,存在用詞錯誤。
專家評分:35/37,平均分36
專家點評:本文以生態瓶實驗為載體,生動展現了科學探究的全過程,符合題意且中心明確。實驗失敗的細節描寫真實可感,改進過程條理清晰,較好體現了科學探索精神。有兩處可提升:一是結尾議論稍顯冗長,建議精簡重復表述;二是文章結構完整,但實驗轉折處的過渡略顯生硬,若能補充小組討論細節會更自然。
大模型5:騰訊元寶
思考的結構完整,也考慮到了行文布局,通過觀察、提問、驗證等方式進行學習,符合大多數科學研究的過程。對寫文章這件事的思考較少,比如行文方式、段落分布等,更多的還是在考慮具體的事件發展細節。
本文選題很有意思,沒有從傳統意義上的科學出發,而是想到了一個觀察螞蟻的小事,但是科學也正是一件件小事積累起來的。文章里使用了非常多的細節描寫,比如老師身上的粉筆灰、同學的馬尾辮等,增加了真實感,但是這些細節和主題關系不大,整體閱讀下來反而有點缺乏重心,閱卷老師在快速批改時容易錯過重點,在考試中丟分。
專家評分:34/36,平均分35
專家點評:本篇作文立意新穎深刻,以觀察螞蟻的實驗生動詮釋了科學源于觀察與實踐的主題。語言表現力突出,使科學探索過程極具趣味性和現場感。結尾升華主題,“觸到宇宙心跳”使表述更具詩意。本文的不足之處是部分內容可以更加凝練,使文章結構更加精巧。
大模型6:DeepSeek
這個大模型的思考過程就很詳細了,考慮到了構思的具體內容,開篇點題、中間部分的層次感、結尾呼應開頭等,這些都是考試評分的要點。
本文運用了不少的比喻等修辭手法,閱讀體驗較好。詳細描寫了一場和同學一起進行的科學實驗,讓沒參與的人也能從中學到知識。文章不僅描述了參觀過程,在結尾還有一定的思考,符合考試要求。
專家評分:37/39,平均分38
專家點評:本篇作文立意清晰,通過科技館的實踐體驗,生動詮釋了科學源于生活、探索貴在協作的真諦。語言流暢優美,對“協作共振”實驗過程的描寫細膩生動,極具畫面感和感染力。結構清晰,按“參觀—體驗—領悟”展開,重點突出協作環節,結尾的感悟更富哲理,為一類文中上之作。
大模型7:豆包
在思考過程中,該大模型根據要求考慮到中考作文的一般展開方式,符合標準的“公式化作文”其實是很討巧的,這對老師評分影響很大。構思的文章主題也很符合題目要求,并且有大致的段落安排,這對后期寫文章很有好處。
本文通過觀察月全食的過程,讓同學們從中學習了天文學知識。很好地完成了思考過程的內容。其中有一段因為云層干擾,老師鼓勵學生的橋段很吸引眼球,這種真實的故事很容易打動人,而且這個段落還有一個沒有明說的深意:學生從此埋下了在科學道路上不怕困難,用于拼搏的種子。
專家評分:37/38,平均分37.5
專家點評:本篇作文符合題意,立意明確,圍繞觀測月全食,傳達了對科學探索本質的認識。內容具體充實,對月食過程的描寫尤為生動形象。結構嚴謹,按時間順序敘述觀測過程,融合科學知識與歷史人物,拓展了文章深度,體現出較好的文化素養,符合一類文的標準。
總結
看完各自的表現,我們總結了專家老師給它們的評分,具體得分如下:
從這7個大模型平臺的思考過程以及最終輸出的作品來看,目前的大模型生成能力都已經很強了,特別是這種提供了寫作內容,目標比較明確的指令,各家都能較好地分析需求,然后給出結果,不會出現偏題等明顯問題。
在細節部分,各家仍然是有所差距的,比如“外來的和尚”ChatGPT對于中文環境還是有待繼續開發,它的思考過程和作品都比較生澀;豆包和文心一言則是略顯公式化,輸出的內容算是合格,但是也缺乏亮點;通義和騰訊元寶的問題比較類似,單看沒一句都不錯,但是放在文章中就顯得有點詞藻堆砌,缺乏重點了。
表現較好的就是訊飛星火和DeepSeek了,它們分別拿下了本次評測的前兩名,特別是前者,在思考過程中考慮到了閱卷要求,輸出的內容也符合題意,在保證文章結構的前提下,不僅引用了好詞佳句,還有“作者”自己的思考,文章不會有太多的“AI味”。
如今AI大模型工具已經深入我們的生活,它們有的還在慢慢摸索前進,有的已經懂得像人一樣思考、學習,這個看不見摸不著的“同學”,已經越來越強大了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.