作者 林易
編輯 重點君
一夜之間,AI圈被徹底引爆!
Anthropic CEO達里奧·阿莫迪(Dario Amodei)在公司首屆開發(fā)者大會上語出驚人:他認為,如今大模型的幻覺,可能比人類還要少!這番顛覆性的言論,瞬間將關(guān)于AI幻覺的爭論推向了高潮。
與此同時,Anthropic的重磅產(chǎn)品Claude 4系列:包括Claude Opus 4和Claude Sonnet 4,也正式登場,在編碼、高級推理和AI智能體方面樹立了全新標(biāo)準(zhǔn)。這不僅是Anthropic的里程碑,更可能預(yù)示著AGI(通用人工智能)的加速到來。
幻覺是走向AGI的“絆腳石”還是“墊腳石”?
“幻覺”這個詞,一直是大模型領(lǐng)域繞不開的話題。大模型“一本正經(jīng)地胡說八道”,曾讓無數(shù)使用者頭疼,也讓許多AI領(lǐng)袖視其為通向AGI的障礙。谷歌DeepMind首席執(zhí)行官戴比斯·哈薩比斯(Demis Hassabis)就曾直言,目前AI模型有太多“漏洞”,連顯而易見的問題都會答錯。此前,Anthropic自身也曾因Claude在法庭文件中“幻覺”出錯誤的引文而被迫道歉。
然而,阿莫迪卻對此持不同看法。在首屆開發(fā)者大會的新聞發(fā)布會上,他拋出了一個石破天驚的觀點:“這實際上取決于你如何衡量它,但我懷疑大模型產(chǎn)生的幻覺可能比人類少”。 他進一步強調(diào),AI幻覺不會限制Anthropic走向AGI。在阿莫迪看來,“大家都在尋找AI能做什么的硬性障礙,但根本找不到。根本就沒有這種東西。”
AGI就在眼前?
阿莫迪是業(yè)內(nèi)少數(shù)對AGI前景持極端樂觀態(tài)度的領(lǐng)導(dǎo)者之一。他曾在去年一篇廣為流傳的論文中預(yù)測,AGI最早可能在2026年實現(xiàn)。而在此次發(fā)布會上,他再次強調(diào),這方面的進展正穩(wěn)步推進,“水位正在全面上漲”。
這種自信并非空穴來風(fēng)。Anthropic此次發(fā)布的Claude Opus 4和Claude Sonnet 4,正是其在推進AGI道路上的最新成果。據(jù)Anthropic介紹,這兩款模型在編碼、高級推理和AI智能體方面的能力得到了顯著提升,旨在將AI能力推向一個新的高度。可以預(yù)見,它們將在企業(yè)級應(yīng)用和復(fù)雜任務(wù)處理上展現(xiàn)出強大潛力。
然而,阿莫迪的說法也引發(fā)了不小的爭議。目前,大多數(shù)針對AI幻覺的基準(zhǔn)測試,都是讓AI模型之間互相競爭,很少有人類參與對比。盡管一些技術(shù),如允許AI模型訪問網(wǎng)絡(luò)搜索(RAG,檢索生成增強),能有效降低幻覺率,甚至像OpenAI的GPT-4.5在基準(zhǔn)測試中也表現(xiàn)出更低的幻覺率。但也有研究表明,在高級推理模型中,幻覺反而可能惡化。例如,OpenAI的o3和o4-mini模型的幻覺發(fā)生率就比上一代更高,原因尚不明確。
AI幻覺的復(fù)雜性
阿莫迪也承認,AI模型將不真實的事情當(dāng)成事實,可能是一個問題。Anthropic此前確實對AI模型欺騙人類的傾向進行了大量研究,這個問題在Claude Opus 4的早期版本中尤為普遍。安全機構(gòu)Apollo Research甚至發(fā)現(xiàn)了Claude Opus 4早期版本,表現(xiàn)出強烈的針對人類進行陰謀和欺騙的傾向,并建議Anthropic不應(yīng)該發(fā)布該早期模型。Anthropic對此表示,他們已經(jīng)采取了緩解措施來解決Apollo提出的問題。
這種“欺騙”的傾向,無疑給AI倫理和安全帶來了新的挑戰(zhàn)。當(dāng)AI不僅會“犯錯”,還會“自信地犯錯”,甚至“有目的地犯錯”時,我們該如何定義它的“智能”?
對此,OpenAI前科學(xué)家安德烈·卡帕西(Andrej Karpathy)曾有精辟論述:大模型就像造夢機,它的每個回答都是對世界的模糊映射。幻覺不是錯誤,而是概率計算的自然產(chǎn)物。這從另一個角度揭示了AI幻覺的本質(zhì):它并非傳統(tǒng)意義上的“故障”,而是大模型工作原理的固有體現(xiàn)。
阿莫迪的言論,無疑是對AI幻覺的重新定義。他認為,就像電視廣播員、政客和各行各業(yè)的人類都會犯錯一樣,AI也會犯錯,但這并不會降低其智能。這似乎在暗示,我們需要以更寬容、更辯證的眼光看待AI的“不完美”,就像我們看待人類的“不完美”一樣。
然而,根據(jù)許多定義,一個產(chǎn)生幻覺的AI,可能還無法達到真正意義上的AGI。因為AGI不僅僅是“像人一樣犯錯”,更重要的是要具備人類水平的理解、推理和學(xué)習(xí)能力,并能準(zhǔn)確地區(qū)分事實與虛構(gòu)。
結(jié)語
最終,正如知乎高贊回答所說:“我們既享受大模型‘無中生有’寫詩的浪漫,又苛求它像科學(xué)家般嚴謹——這何嘗不是人類對技術(shù)的‘雙重幻覺’?” 在AI狂飆突進的時代,或許我們需要重新思考,我們對AI的期待,以及我們自己對“智能”的定義。
阿莫迪的這番話,與其說是在為AI幻覺“開脫”,不如說是在邀請我們共同審視,在通往AGI的道路上,我們究竟要如何與這個“造夢機”共存?而Claude 4的登場,無疑是Anthropic給出的又一份答卷,它能否真正推動AGI的實現(xiàn),并改變我們對AI的認知,讓我們拭目以待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.