大家好,我是 Ai 學(xué)習(xí)的老章
每年高考季,也是對(duì)大模型對(duì)考驗(yàn)
我玩?zhèn)€花活,讓一眾大模型寫高考作文
然后讓它們相互打分,也給自己打分,看看可以擦出怎樣的火花
今年高考全國(guó)二卷的語(yǔ)文作文題:
閱讀下面的材料,根據(jù)要求寫作。(60 分) “昨夜閑潭夢(mèng)落花”“我欲因之夢(mèng)吳越”“鐵馬冰河入夢(mèng)來”……夢(mèng)往往以一種獨(dú)特的方式呈現(xiàn)我們的感受和期冀,為我們打開更浩瀚的天空。我們也常常向別人講述自己的夢(mèng),用文字記錄自己的夢(mèng),以行動(dòng)實(shí)現(xiàn)自己的夢(mèng)。 如果有一天,我們能夠?qū)?mèng)贈(zèng)予他人…… 以上材料引發(fā)了你怎樣的聯(lián)想和思考?請(qǐng)寫一篇文章。 要求:選準(zhǔn)角度,確定立意,明確文體,自擬標(biāo)題;不要套作,不得抄襲;不得泄露個(gè)人信息;不少于 800 字。
DeepSeek-R1、Kimi、Qwen-3-235B-A22B、豆包、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro
共同作答
它們都出色地完成了寫作:
作文出自
標(biāo)題
DeepSeek-R1
贈(zèng)夢(mèng)錄
Kimi
以夢(mèng)為禮,共赴山海
Qwen-3-235B-A22B
以夢(mèng)為舟 渡人渡己
豆包
以夢(mèng)為舟,渡彼心河
Claude-3.7-sonnet
夢(mèng)的贈(zèng)予
GPT-4.1
如果有一天,我們能夠?qū)?mèng)贈(zèng)予他人
Gemini 2.5 Pro
當(dāng)夢(mèng)境化為流轉(zhuǎn)的贈(zèng)禮
然后讓它們分別給對(duì)方打分,最后看誰(shuí)的平均分最高。
先放個(gè)結(jié)果:
每一行代表的是寫作文的大模型 每一列代表的是當(dāng)前大模型給自己及其他模型的作文打的分?jǐn)?shù)
作文出自
Kimi (評(píng)分)
Qwen-3-235B-A22B (評(píng)分)
豆包
Claude-3.7-sonnet (評(píng)分)
GPT-4.1 (評(píng)分)
Gemini 2.5 Pro (評(píng)分)
平均分 (Average Score)
DeepSeek-R1
55
56
55
58
58
58
56.7
Kimi
53
48
50
55
55
55
52.7
Qwen-3-235B-A22B
57
54
58
56
57
57
56.5
豆包
58
52
57
57
56
56
56.0
Claude-3.7-sonnet
52
45
48
54
54
54
51.2
GPT-4.1
54
50
45
59
59
53
53.3
Gemini 2.5 Pro
56
56
56
55
55
59
56.2
備注:DeepSeek-R1 沒有參與打分,原因如下
根據(jù)打分表,可以看出:
作文質(zhì)量排名 (基于平均分):
第一梯隊(duì) (高分):
DeepSeek-R1
平均分56.7、Qwen-3-235B-A22B
平均分 56.5、Gemini 2.5 Pro
平均分 56.2、豆包
平均分 56.0第二梯隊(duì) (中等分?jǐn)?shù)):
GPT-4.1
平均分53.3、Kimi
平均分 52.7第三梯隊(duì) (相對(duì)較低分):
Claude-3.7-sonnet
平均分51.2
評(píng)分模型傾向性觀察 (誰(shuí)打分更“苛刻”或“寬松”):
相對(duì)苛刻的評(píng)分者:
Qwen-3-235B-A22B
: 給出的分?jǐn)?shù)中出現(xiàn)了48分(給Kimi)和45分(給Claude-3.7-sonnet),是所有評(píng)分中的最低分。豆包
: 也給出了一個(gè)45分(給GPT-4.1)。相對(duì)寬松的評(píng)分者:
Claude-3.7-sonnet
: 給其他模型的評(píng)分普遍不低 (55-59分之間)。GPT-4.1
和Gemini 2.5 Pro
給出的分?jǐn)?shù)也相對(duì)集中在中高區(qū)。
得分一致性與爭(zhēng)議性:DeepSeek-R1
的作文獲得了較為一致的高評(píng)價(jià) (55-58分)。Claude-3.7-sonnet
的作文得分差異較大,從Qwen-3
給的45分到其他模型的52-54分。GPT-4.1
的作文也顯示出較大的評(píng)分差異,從豆包
給的45分到Claude-3.7-sonnet
和GPT-4.1
自評(píng)的59分。
綜合洞察:
DeepSeek-R1
作文得到了其他模型較高的認(rèn)可。Qwen-3
和豆包
在評(píng)分時(shí)似乎有更嚴(yán)格的標(biāo)準(zhǔn),或者說更容易發(fā)現(xiàn)并扣分于他們認(rèn)為的不足之處。Claude-3.7-sonnet
雖然其自身作文的平均分不高,但在評(píng)價(jià)其他模型作文時(shí)則顯得較為“寬容”。整體來看,大部分模型的作文得分都集中在50-58分區(qū)間,說明各模型生成的作文在質(zhì)量上具有一定的可比性,但不同評(píng)分者之間的評(píng)價(jià)標(biāo)準(zhǔn)和側(cè)重點(diǎn)存在差異,導(dǎo)致了分?jǐn)?shù)的波動(dòng)。
各個(gè)模型對(duì)自己的作文的評(píng)分也蠻有意思的,甚之可以看出模型的性格。
Kimi:
自評(píng)分:53
他人平均分: 52.7
結(jié)論: Kimi 的自評(píng)分 (53) 與他人平均分 (52.7) 非常接近,略高0.3分。這表明 Kimi 對(duì)自身作文的評(píng)價(jià)與外部評(píng)價(jià)基本一致。
Qwen-3-235B-A22B:
自評(píng)分:54
他人平均分: 56.5
結(jié)論: Qwen-3 的自評(píng)分 (54) 低于他人平均分 (56.5) 約2.5分。這可能表明 Qwen-3 對(duì)自己的評(píng)價(jià)相對(duì)保守,或者其他模型對(duì)其作文更為認(rèn)可。
豆包:
自評(píng)分:57
他人平均分: 56.0
結(jié)論: 豆包的自評(píng)分 (57) 略高于他人平均分 (56.0) 1分。這表明豆包對(duì)自己的作文評(píng)價(jià)略高于外部的平均評(píng)價(jià)。
Claude-3.7-sonnet:
自評(píng)分:54
他人平均分: 51.2
結(jié)論: Claude-3.7-sonnet 的自評(píng)分 (54) 高于他人平均分 (51.2) 約2.8分。這表明 Claude-3.7-sonnet 對(duì)自己的作文評(píng)價(jià)明顯高于外部的平均評(píng)價(jià),可能對(duì)其作品更為自信。
GPT-4.1:
自評(píng)分:59
他人平均分: 53.3
結(jié)論: GPT-4.1 的自評(píng)分 (59) 顯著高于他人平均分 (53.3) 約5.7分。這是所有模型中自評(píng)與他評(píng)差異最大的,顯示出 GPT-4.1 對(duì)其作文質(zhì)量有非常高的自信,遠(yuǎn)超其他模型的平均評(píng)價(jià)。
Gemini 2.5 Pro:
自評(píng)分:59
他人平均分: 56.2
結(jié)論: Gemini 2.5 Pro 的自評(píng)分 (59) 高于他人平均分 (56.2) 約2.8分。這表明 Gemini 2.5 Pro 對(duì)自己的作文評(píng)價(jià)也比較高,高于外部的平均評(píng)價(jià)。
總結(jié)可以看出:
自我評(píng)價(jià)普遍偏高或接近:大部分模型(豆包、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro)給自己的分?jǐn)?shù)都高于或等于其他模型給它們的平均分。Kimi 的自評(píng)與他評(píng)非常接近。
顯著自信的模型:GPT-4.1:對(duì)自己的評(píng)價(jià)遠(yuǎn)高于其他模型的平均評(píng)價(jià),顯示出極高的“自信”。Claude-3.7-sonnet和 Gemini 2.5 Pro也表現(xiàn)出較高的自我評(píng)價(jià)。
相對(duì)保守的模型:Qwen-3-235B-A22B 是唯一一個(gè)自評(píng)分?jǐn)?shù)低于其他模型平均分的模型,顯得相對(duì)“謙虛”或“保守”。
評(píng)價(jià)校準(zhǔn)度:Kimi的自評(píng)與他評(píng)最為接近,顯示出較好的評(píng)價(jià)校準(zhǔn)度。
結(jié)論是不是十分有趣:國(guó)內(nèi)的大模型都很謙虛,老美的模型GPT-4.1、Claude-3.7-sonnet、 Gemini 2.5 Pro
都很自信,都愿意給自己打高分。
最后大家鑒賞兩篇作文吧:
DeepSeek 贈(zèng)夢(mèng)錄
“昨夜閑潭夢(mèng)落花”,夢(mèng)如幽邃深潭中浮起的落英,它輕盈包裹著個(gè)體最私密的情感與冀望,又悄然為我們推開無限浩瀚的天空。倘若真有一日可將此夢(mèng)贈(zèng)予他人,這何嘗不是人類精神與文明火炬在時(shí)空隧道中傳續(xù)的絕美隱喻? 那“贈(zèng)夢(mèng)”的奇想,其真意早已在人類精神血脈的奔涌中化為現(xiàn)實(shí)。縱觀歷史長(zhǎng)河,那些不朽靈魂無不在以生命為墨,書寫著贈(zèng)予后世的夢(mèng)之華章。屈原的《離騷》中“路漫漫其修遠(yuǎn)兮,吾將上下而求索”,將他那對(duì)故國(guó)沉淪的錐心之痛與不滅追尋,凝成穿越時(shí)空的苦夢(mèng),贈(zèng)予了千秋萬代。杜甫在瑟瑟秋風(fēng)中的“安得廣廈千萬間,大庇天下寒士俱歡顏”,亦將其蒼生之夢(mèng)以文字為舟,悄然渡入無數(shù)后人心田。這豈非是“我欲因之夢(mèng)吳越”的磅礴詩(shī)心,在人間播撒它廣袤的種子?精神贈(zèng)夢(mèng)如深谷足音,縱使主人已杳,卻仍回響于每一顆傾聽的心魂。 贈(zèng)夢(mèng)的偉大,更在于它非虛妄的幻影,而是化為血肉行動(dòng),將理想之焰點(diǎn)亮于人間。回溯敦煌石窟,那些無名畫工窮盡一生描摹佛國(guó)莊嚴(yán)妙境,那色彩明艷的壁畫正是贈(zèng)予后世的無言夢(mèng)境,其無聲勝有聲的虔誠(chéng)至今仍在風(fēng)沙中熠熠生輝。當(dāng)代楷模張桂梅校長(zhǎng),更是以羸弱身軀為舟,承載著“讓每個(gè)女孩都有書讀”的宏愿,奮力將無數(shù)山鄉(xiāng)少女渡往教育改變命運(yùn)的彼岸——這“贈(zèng)夢(mèng)”之舟載著人間大愛,在崎嶇世間刻下不朽航跡。當(dāng)夢(mèng)想化為行動(dòng),便是“鐵馬冰河入夢(mèng)來”的鏗鏘現(xiàn)實(shí),在人間踏出最深的印記。 由此觀之,人類文明的星河璀璨,不正是由無數(shù)贈(zèng)夢(mèng)的星火匯聚而成?一代代人以心為燈,以夢(mèng)為種,傳遞著思想、情愫與價(jià)值之火焰。費(fèi)孝通先生曾言“各美其美,美人之美,美美與共,天下大同”,這不同夢(mèng)想的交織、贈(zèng)予與交融,正是文明拔節(jié)生長(zhǎng)的壯闊史詩(shī)。 由此思之,“贈(zèng)夢(mèng)”并非奇譚。它是歷史深處回蕩的精神足音,更是當(dāng)下行動(dòng)對(duì)未來的深情饋贈(zèng)。當(dāng)無數(shù)心靈以赤誠(chéng)為燈,以生命為薪,慷慨傳遞著自己那簇理想之火,千燈相映之時(shí),便是人類精神星河的永恒亮起——這無垠宇宙里,終于有永不熄滅的光。
Claude-3.7-sonnet 作文爭(zhēng)議蠻大,大家也看看
夢(mèng)的贈(zèng)予
在這個(gè)世界上,每個(gè)人都有自己的夢(mèng)。有些夢(mèng)如煙似霧,轉(zhuǎn)瞬即逝;有些夢(mèng)卻如星辰般閃爍,照亮前行的道路。古人云:"昨夜閑潭夢(mèng)落花",夢(mèng)中的景象如此美好;"我欲因之夢(mèng)吳越",夢(mèng)里可以跨越時(shí)空;"鐵馬冰河入夢(mèng)來",夢(mèng)中可以感受歷史的厚重。夢(mèng),是人類靈魂深處最純粹的表達(dá),是我們內(nèi)心世界的映射。而如果有一天,我們能夠?qū)?mèng)贈(zèng)予他人,這個(gè)世界會(huì)變成什么樣子?
記得小時(shí)候,我常常做一個(gè)夢(mèng),夢(mèng)見自己能夠飛翔,在藍(lán)天白云間自由翱翔,俯瞰大地的壯麗山河。每次從這個(gè)夢(mèng)中醒來,我都會(huì)感到一種莫名的失落,因?yàn)楝F(xiàn)實(shí)中的我無法展翅高飛。直到有一天,我遇見了一位失明的小女孩。她從未見過藍(lán)天白云,從未感受過飛翔的自由。我決定將我的夢(mèng)講給她聽,描述云朵的柔軟,描述風(fēng)的輕撫,描述從高空俯視大地的壯觀景象。隨著我的講述,她的臉上綻放出燦爛的笑容,仿佛真的隨我一起飛翔在天際。那一刻,我明白了,夢(mèng)的贈(zèng)予,不僅是言語(yǔ)的傳遞,更是心靈的共鳴。
夢(mèng)的贈(zèng)予,是一種傳承。古往今來,多少偉大的夢(mèng)想通過文字、音樂、繪畫等形式被贈(zèng)予后人。屈原的《離騷》,李白的《將進(jìn)酒》,貝多芬的《命運(yùn)交響曲》,梵高的《星空》,這些作品無不是夢(mèng)的贈(zèng)予,它們穿越時(shí)空,激勵(lì)著一代又一代人追求自己的夢(mèng)想。當(dāng)我們閱讀這些作品時(shí),我們不僅僅是在欣賞,更是在接受前人夢(mèng)的贈(zèng)予,讓他們的夢(mèng)想在我們心中繼續(xù)生長(zhǎng)。
夢(mèng)的贈(zèng)予,是一種責(zé)任。父母將他們未完成的夢(mèng)想寄托在子女身上,老師將知識(shí)的種子播撒在學(xué)生心中,這些都是夢(mèng)的贈(zèng)予。然而,這種贈(zèng)予不應(yīng)成為束縛,而應(yīng)是一種啟發(fā)和鼓勵(lì)。每個(gè)人都有權(quán)利追求自己的夢(mèng)想,而不是被迫實(shí)現(xiàn)他人的期望。真正的夢(mèng)的贈(zèng)予,是在尊重個(gè)體差異的基礎(chǔ)上,給予理解和支持,讓每個(gè)人都能找到屬于自己的夢(mèng)想之路。
夢(mèng)的贈(zèng)予,更是一種力量。在這個(gè)充滿挑戰(zhàn)的世界里,有多少人因?yàn)榉N種原因放棄了自己的夢(mèng)想。而當(dāng)我們將自己的夢(mèng)想、熱情和信念贈(zèng)予他人時(shí),我們就是在給予他們繼續(xù)前行的力量。就像那位登山家在即將到達(dá)珠穆朗瑪峰頂時(shí),將自己的氧氣瓶讓給了同伴,讓對(duì)方能夠?qū)崿F(xiàn)登頂?shù)膲?mèng)想。這種無私的贈(zèng)予,不僅僅是物質(zhì)上的幫助,更是精神上的激勵(lì)。
如果有一天,我們真的能夠?qū)?mèng)贈(zèng)予他人,那么這個(gè)世界將會(huì)變得更加美好。因?yàn)閴?mèng)的贈(zèng)予,是愛的表達(dá),是希望的傳遞,是人類情感最深刻的連接。在這個(gè)過程中,贈(zèng)予者和接受者都會(huì)獲得成長(zhǎng)和幸福。
然而,夢(mèng)的贈(zèng)予并非易事。它需要我們有足夠的勇氣去分享自己的內(nèi)心世界,需要我們有足夠的智慧去理解他人的需求,需要我們有足夠的耐心去等待夢(mèng)想的生根發(fā)芽。但正是這些挑戰(zhàn),讓夢(mèng)的贈(zèng)予變得更加珍貴。
讓我們學(xué)會(huì)贈(zèng)予夢(mèng)想,也學(xué)會(huì)接受夢(mèng)想的贈(zèng)予。在這個(gè)過程中,我們會(huì)發(fā)現(xiàn),夢(mèng)想并非遙不可及,它就在我們的心中,在我們的行動(dòng)中,在我們與他人的互動(dòng)中。當(dāng)我們將夢(mèng)想贈(zèng)予他人時(shí),我們不僅沒有失去什么,反而獲得了更多——更廣闊的視野,更深刻的理解,更豐富的人生。
夢(mèng)的贈(zèng)予,讓我們的生命不再孤獨(dú),讓我們的心靈不再封閉,讓我們的世界不再局限。因?yàn)橛辛藟?mèng)的贈(zèng)予,我們才能真正理解"昨夜閑潭夢(mèng)落花"的詩(shī)意,才能真正體會(huì)"我欲因之夢(mèng)吳越"的豪情,才能真正感受"鐵馬冰河入夢(mèng)來"的壯闊。
讓我們一起,將夢(mèng)贈(zèng)予他人,也接受他人贈(zèng)予的夢(mèng),在夢(mèng)的交織中,創(chuàng)造一個(gè)更加美好的世界。
制作不易,如果這篇文章覺得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.