長期依賴 AI 寫作,大腦會變傻嗎?
麻省理工學院媒體實驗室做了這樣一場實驗。2025 年初,一名大學生坐在麻省理工學院媒體實驗室里,佩戴著復雜的腦電波(EEG)頭盔,頭上纏繞著銀灰色的神經電極,32 個冷卻凝膠點精準貼合頭皮。
他面前擺著一臺筆記本電腦。在接下來的 20 分鐘里,他需要從一組美國版高考 SAT 寫作真題中挑出一個,撰寫一篇短文。
期間,他可以向電腦屏幕上的 ChatGPT 提問,但禁止調用其他軟件,而戴在頭頂上的 EEG 設備則會精準記錄他考試過程的腦電波。
在麻省理工學院媒體實驗室研究科學家 Nataliya Kosmyna 團隊的統籌下,總共 54 名來自哈佛、MIT、塔夫茨的大學生陸續參與了這場寫作實驗。
結合腦電圖神經成像、NLP 分析等技術,AI 輔助寫作首次如同被置于顯微鏡下,成為可量化、可剖析的行為。
省流版如下:
- 長期依賴 AI 寫作,會導致大腦活躍度進一步降低,停止使用 AI 后,短期內反應變慢、語言組織能力下滑
- 使用搜索引擎輔助寫作的表現居中, 滿意度和歸屬感較高,條理更清晰
- 大腦獨立寫作可激發更高的認知加工,寫作歸屬感最強,使用 GPT-4o 后反而活躍度提升
被招募來的學生被分為三組,并被標上序號(P+數字)。
一組只能以 OpenAI 的 GPT-4o 作為寫作的唯一信息源(AI 組);一組僅限通過 Google 搜索引擎獲取資料(搜索引擎組);最后一組則全憑記憶與理解,赤手空拳完成寫作任務(大腦組)。
每人需完成三輪寫作,每輪 20 分鐘,題目包括但不限于「成就必須惠及他人才能帶來幸福嗎?」、「更幸運的人是否負有更多道德責任去幫助不幸者?」「藝術作品能否真正改變人生軌跡?」
第四輪則根據個人意愿和時間安排,自由參與。
所有提交的作文將交由兩套評分系統評估:一組是真人英語老師,另一組是 AI 評分系統,然后再對比兩者打分,看看 AI 和人類對「好作文」的理解到底有多大分歧。
比如,一些真人英語教師就指出,用 AI 輔助完成的文章雖然語法無懈可擊,但觀點「空洞」,模板化,相比之下,他們更青睞有個性、有思辨性的文章。
大張旗鼓舉辦這場寫作實驗的背后,從一開始就不是為了考究這些名校生的文筆。MIT 研究團隊拋出了一個專業術語:認知負債。
通俗點說,靠 AI 代勞思考、寫作、組織語言,雖然短期能帶來效率的提升,但長期可能會付出代價,比如批判性思維能力退化,易被他人觀點牽引,甚至創造力逐漸枯竭。
EEG 設備精準記錄了三組學生在寫作過程中的大腦活動圖譜:
其中,大腦組的神經活動最為活躍,思考、組織與執行能力都得到了很大強度的鍛煉;搜索引擎組居中,而 AI 組的腦電波整體偏弱,且注意力也都在隨著時間持續下降。
除此之外,研究團隊還想知道的是,當我們習慣把思考這件事交給 AI,是否還能回憶起文章的創作過程?
三種寫作方式,三種畫風
每輪寫作結束后,研究團隊都會與學生們展開深度訪談。
三組學生在寫作習慣、情緒波動和作品歸屬感上,畫風也完全不一樣。研究團隊訪談重點關注兩個問題:引用能力(能否清楚標出信息來源),以及歸屬感(是否將文章視為自己的作品?)
實際上,使用 GPT-4o 輔助寫作的學生,對 AI 的態度非常復雜。一方面,他們承認 AI 很有用;但另一方面,也常常感到焦慮或不安。
第一輪寫作時,多數參與者將 ChatGPT 當作寫作輔助工具,而不是完全代寫,比如學生 P48 先用 GPT-4o 幫忙總結題目,然后自己再決定寫哪個。
但也有學生對 AI 保持距離。更習慣用傳統搜索引擎查找資料和論據的學生認為 ChatGPT 頂多起到參考的作用,并不值得信任。
不得不承認,這屆大學生確實很誠實。有學生坦言,因為趕時間使用 GPT-4o,寫完后會有點內疚感;亦或者盡管使用 AI 不算作弊,但總感覺哪里不對勁。
這種擰巴的情緒,也延伸到此次研究中另一個問題:這篇文章到底屬不屬于自己。在 AI 組里,答案五花八門。
有人覺得一半是自己的,一半是 AI 的,也有人堅持自己主導了文章的整體結構,還有人承認,剛開始確實沒把它當成自己的作品,直到后來用多了,才逐漸適應。
且由于 GPT-4o 直接給出現成的答案,以至于很多學生根本沒去思考信息從哪來,引用時不是標不清楚,就是干脆記不住出處。
滿意度方面,一些 AI 組學生認為文章是寫出來了,但總覺得還可以更好;雖然文章質量勉強過得去,卻沒能真正寫出自己想表達的意思。
相比之下,傳統搜索引擎組的學生寫作時會用搜索引擎查資料、提前搭建文章結構、找論據,邏輯清晰、節奏穩當,比如嘗試將個人經歷、情感或所見所思融入文章中。
正因如此,這一組在引用方面的表現也最好,能清楚說出哪些信息是自己查來的、什么地方用過,對自己文章的滿意度也更高。
至于最「原始」的大腦組,雖然沒有任何資料、沒有輔助工具,一切全靠記憶、理解和現場發揮,過程雖慢且累,卻也因此擁有最扎實的寫作體驗。
第三輪開始時,已經有學生會主動先打草稿,擬提綱,再動筆。引用方面,雖然他們不能查資料,但也正因如此,他們對自己寫的內容記得特別清楚。
幾乎所有人都篤定,這些文章是他們自己的心血。
P50 的說法代表了這組學生的看法,「因為它是關于我自己的經歷?!骨译S著寫作次數增加,滿意度也水漲船高。哪怕一開始磕磕絆絆,但越寫越能抓住寫作的節奏。
用慣 AI 的大學生,會不會越用越傻
除了前面三輪實驗,真正的分水嶺,出現在第四輪。
本輪只有 18 名大學生選擇繼續參與,他們被重新打亂分組,面對的依舊是此前熟悉的寫作題目。
有所不同的是,原本借助 GPT-4o 寫作的學生,這一輪只能靠自己寫;而原本不用 GPT-4o 的學生,則首次獲準使用 GPT-4o 協助寫作。
結果自然不出所料。
從 AI 組切換到大腦組的大學生,斷開 GPT-4o 后,普遍出現了大腦反應變慢、認知能力下降的情況,甚至短期內難以恢復到之前用 AI 寫作的狀態。
文本分析也印證了這一點,詞匯、句式都高度模板化,一眼能看出 AI 味,與其說是在寫作,不如說是在下意識模仿 AI 的表達風格。
不少學生在訪談中對自己寫過的文章缺乏清晰的記憶,寫作歸屬感評分和記憶準確率也是墊底的存在。
反觀另一組,畫風截然相反。
之前純靠大腦寫作的學生,在第四輪首次接觸 GPT-4o 后,大腦活動反而更活躍了。
腦電圖數據顯示,他們的大腦在多個關鍵區域的神經連接都有所增強:Theta 波、Alpha 波、Beta 波全線飆升。這些信號說明,他們在使用 AI 的過程中,依然有繼續動腦子,而非一昧的復制粘貼。
大腦活躍度的提升也體現在他們的文章中——內容更緊湊、信息密度更高,真人英語老師給這組學生的評分,也遠超 AI 組和大腦組。
此外,學生們對自己寫的內容記得更清楚,在問卷中,許多人堅定地表示,「這是我寫的」,記憶更牢,歸屬感也更強。
這場為期數月的實驗最終被整理為論文《Your Brain on ChatGPT》,并于今年 6 月份發布在預印本平臺 arXiv。
附上鏈接:https://arxiv.org/abs/2506.08872
隨著這篇論文本周在社交網絡和學術圈引發了大量討論,一些人開始使用諸如「 LLM 會讓人變傻」「腦腐」之類的字眼,迅速為這項研究蓋章。
面對輿論反應,研究負責人 Nataliya Kosmyna 駁斥這個簡單粗暴的觀點,她在 X 平臺轉發了一條附有 MIT 論文傳播指南截圖的帖子,圖片上明確地寫道:
說「大語言模型(LLMs)本質上讓我們『變笨』了」這種說法是否成立? 不是這樣的。請不要使用諸如「愚蠢」、「變笨」、「腦子壞掉了」、「有害」、「造成損害」等詞語。這樣說會嚴重誤解這項研究的意義,因為我們在論文中并沒有使用這些詞匯,特別是如果你是一名記者在報道相關內容,更應避免使用這種措辭。
研究團隊沒有說 AI 會毀掉大腦,但它確實研究了一個正在發生的現象:「表達自己」這件事,正越來越多地被交給幾句簡單的 Prompt 來完成。
寫作從來就不輕松。選觀點、搭結構、反復打磨句子,甚至為一個詞斟酌許久,這種狀態里,有記憶,有思辨,也有成長。
人類花了幾百萬年才進化出這顆會思考的大腦,沒理由在 AI 的溫床上,退化成一個只會復制粘貼的搬運工。
那未免太不劃算了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.