大數據文摘出品
最近,麻省理工學院的研究團隊發表了一項新研究,標題為《你的大腦與ChatGPT》,研究報告長達200頁。
結論指出:使用AI寫作助手,例如ChatGPT,正在悄然改變人類大腦的運作方式。
為了解釋這一結論,研究團隊提出了一個核心概念:“認知負債”。即一種因為過度依賴AI而削弱思維能力和學習過程的心理狀態。
論文地址: https://arxiv.org/pdf/2506.08872v1
01 研究了啥,如何研究的?
麻省理工學院媒體實驗室的研究人員,主導了這項關于認知成本的研究。
他們深入探究了在日常寫作任務中,使用大型語言模型(LLMs)所帶來的影響。
研究將54名大學生隨機分為三組,他們主要來自波士頓地區的五所大學。
第一組(LLM組)被允許使用OpenAI的GPT-4o模型完成寫作任務;
第二組(搜索組)則借助傳統的搜索引擎,但禁止直接生成答案;
第三組(純腦組)在沒有任何外部工具輔助的情況下,獨立完成所有寫作。
在長達四個月的時間里,所有參與者需要完成三場正式的論文寫作。
每一場寫作任務都要求他們在20分鐘內,針對一個真實的SAT考題進行闡述。
研究人員運用腦電圖(EEG)技術,實時追蹤參與者的大腦活動變化。同時,他們還利用自然語言處理(NLP)分析論文的文本特征。
訪談、人類教師評分以及AI評分,共同構成了這項研究的多元評估體系。
一個由18名學生參與的可選第四輪實驗,提供了關鍵的對照數據:部分學生轉換了使用條件:曾使用AI的學生改為獨立寫作,而未用AI的學生首次嘗試使用ChatGPT。
所有參與者都佩戴腦電設備(EEG)以監測寫作過程中的神經活動,并結合自然語言處理工具、教師評分與訪談進行綜合評估。
結果顯示,使用AI工具的學生,其大腦活動明顯較弱。
EEG數據顯示,“大腦獨立組”的神經連接最為強烈且分布廣泛,說明他們在寫作過程中進行了深度思考和高強度的認知投入。
圖注:展示了Alpha波段下,不同組別(LLM組、搜索引擎組、純靠大腦組)的腦電活動分析結果。圖中還標出了統計顯著性,用星號表示:一個星號()代表有一定差異,三個星號(**)說明差異非常明顯。
使用搜索引擎的學生腦部活動居中,說明他們雖然也在整合外部信息,但依舊保留部分主動思考能力。
而使用ChatGPT的學生則表現出最低程度的神經活躍度,其大腦更多采用機械化處理方式,減少了對執行控制與工作記憶的依賴。更令人警覺的是,AI組的神經連接在前三輪寫作中持續下降。
研究者解釋,這是因為大腦正在“適應”將認知負擔轉移給AI的過程,也就是逐漸放棄自己思考的責任。
在第四輪寫作中,那些從AI寫作轉換為獨立寫作的學生,表現出比“原始大腦組”更弱的神經活動。盡管他們比第一次寫作的“新手”略好,但依然遠遠達不到長期獨立思考者的水平。
圖注:參與者在實驗過程中佩戴Enobio腦電頭戴設備和AttentivU頭戴設備,并使用BioSignal Recorder軟件進行數據記錄。
02 研究有哪些結論?
研究者認為,這種狀態表明:一旦你早期依賴AI,你的大腦就很難再找回原本的活躍程度。
相反,那些首次接觸ChatGPT的學生,其腦電活動反而激增。
這或許是因為他們在嘗試將AI輸出與自己原有的思路融合,觸發了更復雜的認知加工。
然而,腦電圖的變化只是第一層證據。更深層的問題體現在學生寫作內容的“單一性”與“缺乏記憶”。
自然語言分析表明,AI組的文章在結構和語氣上更加統一,出現較多命名實體,但整體思路重復性高,語言風格趨于刻板。
這類文章頻繁使用第三人稱描述,缺乏個性表達。訪談結果更具震撼力:超八成AI組學生在寫作后無法準確回憶起他們剛剛寫下的句子,幾乎無人能完美復述。
相比之下,搜索組與大腦組的記憶表現顯著更好。
研究者指出,這是“認知負債”的典型特征之一——AI生成內容在大腦中無法形成深層記憶痕跡。
也就是說,這些文章只是從ChatGPT那里“借來”的,而不是“寫出來”的。
老師評分也印證了這一現象,他們將AI組的文章評價為“套路化”和“空洞”,缺乏思想的重量。
只有那些曾先獨立寫作、后嘗試AI的學生,在使用AI時表現出更多的“元認知行為”。
他們傾向于將AI輸出與自身經驗進行對照分析,這種過程觸發了更多大腦區域的協同運作。
研究進一步指出,AI組在面對熟悉主題時,思維仍呈現高度集中于同一套觀點。
他們反復重復相同的詞組與論點,缺乏對主題的深入分析或批判性思維。
這表明,他們更愿意接受AI提供的框架,而非質疑或重新構建它。
研究者警告,過度依賴語言模型不僅會降低思考能力,還可能削弱判斷力、加劇認知偏差,甚至形成一種“思想外包”的思維習慣。這種習慣若長期發展,將使人越來越難以構建獨立而原創的思想體系。
值得一提的是,這項研究尚未通過同行評審,但結論震驚業界。
研究還指出,盡管搜索引擎也屬于外部工具,但其使用方式需要用戶自行篩選、整合與判斷信息,整體認知負擔仍高于直接接受AI生成文本。
因此,在構建寫作能力或批判性思維時,適度使用搜索工具,遠比依賴生成式AI更具教育價值。
03 研究有哪些限制?
研究還強調,當前實驗存在多個限制。
樣本量較小,僅54人參與,第四輪交叉實驗更僅18人。此外,只使用了OpenAI的ChatGPT,未涵蓋其他語言模型。
團隊表示,未來研究應嘗試更多模型,并考察圖文、語音等多模態任務中的大腦反應差異。
研究任務也未細分為構思、起草與修改等階段,無法準確描述AI在哪一階段對認知干預最明顯。
腦電圖本身也無法精準定位大腦深層結構活動,需要更高分辨率的成像技術,如fMRI進一步驗證。
另外,由于實驗寫作時間被限定為20分鐘,AI組需將部分時間投入工具操作,導致他們比腦力組有更少時間構思與撰寫。
在現實教育場景中,如果時間不再受限,AI對寫作質量和大腦影響是否會有所不同,仍有待觀察。
研究發現,不同組別在選題動機上也有明顯差異。AI組更看重興趣,搜索組則在興趣與熟悉度間權衡,而腦力組傾向選擇自己做過的題材,以應對沒有外援的寫作挑戰。
這種策略差異,或許揭示了技術使用環境對學習策略與認知目標的潛在塑造作用。
最后,研究還未深入探討AI的不同使用方式——例如,僅用于提綱規劃、語法糾錯,是否同樣會產生“認知負債”。
作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.