圖靈獎得主楊立昆將大模型(特別是自回歸大語言模型,如GPT)稱為“高級復讀機”,主要是基于以下幾個方面的批評和觀點:
1. 基于統計概率的生成機制
楊立昆指出,自回歸大語言模型的核心邏輯是根據前文預測下一個詞(Token)。這種機制本質上是一種基于統計概率的“鸚鵡學舌”,缺乏真正的理解能力。例如,模型可能會生成看似流暢但邏輯上不合理的文本,且無法意識到自己的錯誤。
2. 指數級誤差累積
自回歸模型在生成文本時,每個預測的微小誤差會隨著文本長度呈指數級增長。楊立昆以珠穆朗瑪峰海拔被錯誤寫成“884米”為例,說明模型無法自我糾錯,導致生成內容的正確率大幅下降。
3. 缺乏物理直覺和具身認知
楊立昆認為,當前的大語言模型缺乏對物理世界的直觀理解,例如無法理解物體的不可穿透性。這種缺陷使得模型在處理現實世界中的復雜問題時顯得力不從心,而人類智能是通過多模態感知(視覺、聽覺、觸覺等)逐步建立起來的。
4. 算力浪費與效率低下
楊立昆批評自回歸模型對所有問題都采用暴力計算的方式,消耗大量算力,但無法體現出真正的智能。例如,回答簡單問題和復雜問題消耗的算力完全相同,這種資源分配方式非常不合理。
5. 缺乏真正的推理和規劃能力
楊立昆認為,當前的大語言模型無法進行有效的推理和規劃,只是在重復人類已經輸入的文本數據。他強調,真正的智能應該能夠根據任務的復雜性動態分配計算資源,而不是簡單地依賴概率生成。
6. 對未來的展望
楊立昆提出,未來的AI應該具備內在世界模型、因果推理和自主意識,而不是僅僅依賴文本數據進行生成。他認為,當前的自回歸模型注定會被淘汰,未來需要構建具身智能架構,讓AI真正理解物理世界。
綜上所述,楊立昆將大模型稱為“高級復讀機”,主要是因為這些模型在生成文本時缺乏真正的理解能力、推理能力以及對物理世界的直觀感知,而更多地依賴于統計概率和數據復現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.