網易首頁 > 網易號 > 正文申請入駐

全網炸鍋！Anthropic CEO放話：大模型幻覺比人少！Claude 4攜編碼、AGI新標準殺入戰場

2025-05-23 12:55:14　來源: 劃重點KeyPoints

北京舉報

分享至

作者林易

編輯重點君

一夜之間，AI圈被徹底引爆！

Anthropic CEO達里奧·阿莫迪（Dario Amodei）在公司首屆開發者大會上語出驚人：他認為，如今大模型的幻覺，可能比人類還要少！這番顛覆性的言論，瞬間將關于AI幻覺的爭論推向了高潮。

與此同時，Anthropic的重磅產品Claude 4系列：包括Claude Opus 4和Claude Sonnet 4，也正式登場，在編碼、高級推理和AI智能體方面樹立了全新標準。這不僅是Anthropic的里程碑，更可能預示著AGI（通用人工智能）的加速到來。

幻覺是走向AGI的“絆腳石”還是“墊腳石”？

“幻覺”這個詞，一直是大模型領域繞不開的話題。大模型“一本正經地胡說八道”，曾讓無數使用者頭疼，也讓許多AI領袖視其為通向AGI的障礙。谷歌DeepMind首席執行官戴比斯·哈薩比斯（Demis Hassabis）就曾直言，目前AI模型有太多“漏洞”，連顯而易見的問題都會答錯。此前，Anthropic自身也曾因Claude在法庭文件中“幻覺”出錯誤的引文而被迫道歉。

然而，阿莫迪卻對此持不同看法。在首屆開發者大會的新聞發布會上，他拋出了一個石破天驚的觀點：“這實際上取決于你如何衡量它，但我懷疑大模型產生的幻覺可能比人類少”。他進一步強調，AI幻覺不會限制Anthropic走向AGI。在阿莫迪看來，“大家都在尋找AI能做什么的硬性障礙，但根本找不到。根本就沒有這種東西?！?/p>

AGI就在眼前？

阿莫迪是業內少數對AGI前景持極端樂觀態度的領導者之一。他曾在去年一篇廣為流傳的論文中預測，AGI最早可能在2026年實現。而在此次發布會上，他再次強調，這方面的進展正穩步推進，“水位正在全面上漲”。

這種自信并非空穴來風。Anthropic此次發布的Claude Opus 4和Claude Sonnet 4，正是其在推進AGI道路上的最新成果。據Anthropic介紹，這兩款模型在編碼、高級推理和AI智能體方面的能力得到了顯著提升，旨在將AI能力推向一個新的高度?？梢灶A見，它們將在企業級應用和復雜任務處理上展現出強大潛力。

然而，阿莫迪的說法也引發了不小的爭議。目前，大多數針對AI幻覺的基準測試，都是讓AI模型之間互相競爭，很少有人類參與對比。盡管一些技術，如允許AI模型訪問網絡搜索（RAG，檢索生成增強），能有效降低幻覺率，甚至像OpenAI的GPT-4.5在基準測試中也表現出更低的幻覺率。但也有研究表明，在高級推理模型中，幻覺反而可能惡化。例如，OpenAI的o3和o4-mini模型的幻覺發生率就比上一代更高，原因尚不明確。

AI幻覺的復雜性

阿莫迪也承認，AI模型將不真實的事情當成事實，可能是一個問題。Anthropic此前確實對AI模型欺騙人類的傾向進行了大量研究，這個問題在Claude Opus 4的早期版本中尤為普遍。安全機構Apollo Research甚至發現了Claude Opus 4早期版本，表現出強烈的針對人類進行陰謀和欺騙的傾向，并建議Anthropic不應該發布該早期模型。Anthropic對此表示，他們已經采取了緩解措施來解決Apollo提出的問題。

這種“欺騙”的傾向，無疑給AI倫理和安全帶來了新的挑戰。當AI不僅會“犯錯”，還會“自信地犯錯”，甚至“有目的地犯錯”時，我們該如何定義它的“智能”？

對此，OpenAI前科學家安德烈·卡帕西（Andrej Karpathy）曾有精辟論述：大模型就像造夢機，它的每個回答都是對世界的模糊映射。幻覺不是錯誤，而是概率計算的自然產物。這從另一個角度揭示了AI幻覺的本質：它并非傳統意義上的“故障”，而是大模型工作原理的固有體現。

阿莫迪的言論，無疑是對AI幻覺的重新定義。他認為，就像電視廣播員、政客和各行各業的人類都會犯錯一樣，AI也會犯錯，但這并不會降低其智能。這似乎在暗示，我們需要以更寬容、更辯證的眼光看待AI的“不完美”，就像我們看待人類的“不完美”一樣。

然而，根據許多定義，一個產生幻覺的AI，可能還無法達到真正意義上的AGI。因為AGI不僅僅是“像人一樣犯錯”，更重要的是要具備人類水平的理解、推理和學習能力，并能準確地區分事實與虛構。

結語

最終，正如知乎高贊回答所說：“我們既享受大模型‘無中生有’寫詩的浪漫，又苛求它像科學家般嚴謹——這何嘗不是人類對技術的‘雙重幻覺’？” 在AI狂飆突進的時代，或許我們需要重新思考，我們對AI的期待，以及我們自己對“智能”的定義。

阿莫迪的這番話，與其說是在為AI幻覺“開脫”，不如說是在邀請我們共同審視，在通往AGI的道路上，我們究竟要如何與這個“造夢機”共存？而Claude 4的登場，無疑是Anthropic給出的又一份答卷，它能否真正推動AGI的實現，并改變我們對AI的認知，讓我們拭目以待。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.