99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

全網炸鍋!Anthropic CEO放話:大模型幻覺比人少!Claude 4攜編碼、AGI新標準殺入戰場

0
分享至



作者 林易

編輯 重點君

一夜之間,AI圈被徹底引爆!

Anthropic CEO達里奧·阿莫迪(Dario Amodei)在公司首屆開發者大會上語出驚人:他認為,如今大模型的幻覺,可能比人類還要少!這番顛覆性的言論,瞬間將關于AI幻覺的爭論推向了高潮。

與此同時,Anthropic的重磅產品Claude 4系列:包括Claude Opus 4和Claude Sonnet 4,也正式登場,在編碼、高級推理和AI智能體方面樹立了全新標準。這不僅是Anthropic的里程碑,更可能預示著AGI(通用人工智能)的加速到來。

幻覺走向AGI的“絆腳石”還是“墊腳石”?

“幻覺”這個詞,一直是大模型領域繞不開的話題。大模型“一本正經地胡說八道”,曾讓無數使用者頭疼,也讓許多AI領袖視其為通向AGI的障礙。谷歌DeepMind首席執行官戴比斯·哈薩比斯(Demis Hassabis)就曾直言,目前AI模型有太多“漏洞”,連顯而易見的問題都會答錯。此前,Anthropic自身也曾因Claude在法庭文件中“幻覺”出錯誤的引文而被迫道歉。

然而,阿莫迪卻對此持不同看法。在首屆開發者大會的新聞發布會上,他拋出了一個石破天驚的觀點:“這實際上取決于你如何衡量它,但我懷疑大模型產生的幻覺可能比人類少”。 他進一步強調,AI幻覺不會限制Anthropic走向AGI。在阿莫迪看來,“大家都在尋找AI能做什么的硬性障礙,但根本找不到。根本就沒有這種東西?!?/p>

AGI就在眼前?

阿莫迪是業內少數對AGI前景持極端樂觀態度的領導者之一。他曾在去年一篇廣為流傳的論文中預測,AGI最早可能在2026年實現。而在此次發布會上,他再次強調,這方面的進展正穩步推進,“水位正在全面上漲”。

這種自信并非空穴來風。Anthropic此次發布的Claude Opus 4和Claude Sonnet 4,正是其在推進AGI道路上的最新成果。據Anthropic介紹,這兩款模型在編碼、高級推理和AI智能體方面的能力得到了顯著提升,旨在將AI能力推向一個新的高度??梢灶A見,它們將在企業級應用和復雜任務處理上展現出強大潛力。



然而,阿莫迪的說法也引發了不小的爭議。目前,大多數針對AI幻覺的基準測試,都是讓AI模型之間互相競爭,很少有人類參與對比。盡管一些技術,如允許AI模型訪問網絡搜索(RAG,檢索生成增強),能有效降低幻覺率,甚至像OpenAI的GPT-4.5在基準測試中也表現出更低的幻覺率。但也有研究表明,在高級推理模型中,幻覺反而可能惡化。例如,OpenAI的o3和o4-mini模型的幻覺發生率就比上一代更高,原因尚不明確。

AI幻覺的復雜性

阿莫迪也承認,AI模型將不真實的事情當成事實,可能是一個問題。Anthropic此前確實對AI模型欺騙人類的傾向進行了大量研究,這個問題在Claude Opus 4的早期版本中尤為普遍。安全機構Apollo Research甚至發現了Claude Opus 4早期版本,表現出強烈的針對人類進行陰謀和欺騙的傾向,并建議Anthropic不應該發布該早期模型。Anthropic對此表示,他們已經采取了緩解措施來解決Apollo提出的問題。

這種“欺騙”的傾向,無疑給AI倫理和安全帶來了新的挑戰。當AI不僅會“犯錯”,還會“自信地犯錯”,甚至“有目的地犯錯”時,我們該如何定義它的“智能”?

對此,OpenAI前科學家安德烈·卡帕西(Andrej Karpathy)曾有精辟論述:大模型就像造夢機,它的每個回答都是對世界的模糊映射。幻覺不是錯誤,而是概率計算的自然產物。這從另一個角度揭示了AI幻覺的本質:它并非傳統意義上的“故障”,而是大模型工作原理的固有體現。

阿莫迪的言論,無疑是對AI幻覺的重新定義。他認為,就像電視廣播員、政客和各行各業的人類都會犯錯一樣,AI也會犯錯,但這并不會降低其智能。這似乎在暗示,我們需要以更寬容、更辯證的眼光看待AI的“不完美”,就像我們看待人類的“不完美”一樣。

然而,根據許多定義,一個產生幻覺的AI,可能還無法達到真正意義上的AGI。因為AGI不僅僅是“像人一樣犯錯”,更重要的是要具備人類水平的理解、推理和學習能力,并能準確地區分事實與虛構。

結語

最終,正如知乎高贊回答所說:“我們既享受大模型‘無中生有’寫詩的浪漫,又苛求它像科學家般嚴謹——這何嘗不是人類對技術的‘雙重幻覺’?” 在AI狂飆突進的時代,或許我們需要重新思考,我們對AI的期待,以及我們自己對“智能”的定義。

阿莫迪的這番話,與其說是在為AI幻覺“開脫”,不如說是在邀請我們共同審視,在通往AGI的道路上,我們究竟要如何與這個“造夢機”共存?而Claude 4的登場,無疑是Anthropic給出的又一份答卷,它能否真正推動AGI的實現,并改變我們對AI的認知,讓我們拭目以待。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
景甜沒想到,“債務爭議”才過兩年多,張繼科已走上另一條上坡路

景甜沒想到,“債務爭議”才過兩年多,張繼科已走上另一條上坡路

新語愛八卦
2025-07-07 15:29:46
謝波德又要去夏聯砍瓜切菜了!但屬實有點浪費時間!

謝波德又要去夏聯砍瓜切菜了!但屬實有點浪費時間!

田先生籃球
2025-07-08 16:14:11
45歲母親霧天開車買菜失蹤,10年后女兒打車上班,發現是媽媽的愛車

45歲母親霧天開車買菜失蹤,10年后女兒打車上班,發現是媽媽的愛車

今天說故事
2025-07-02 17:31:55
《金瓶梅》西門慶剛死,潘金蓮便告知陳敬濟:“娘今日成全你”

《金瓶梅》西門慶剛死,潘金蓮便告知陳敬濟:“娘今日成全你”

一丈青
2025-07-08 17:11:08
男子帶140多斤1角硬幣兌換被拒,銀行:客戶無法說明來源

男子帶140多斤1角硬幣兌換被拒,銀行:客戶無法說明來源

新京報
2025-07-07 23:27:12
中方禁止入境后,不到24小時,馬科斯親信回應2句話,態度很囂張

中方禁止入境后,不到24小時,馬科斯親信回應2句話,態度很囂張

通文知史
2025-07-08 18:45:04
2025江蘇高考提前批投檔線公布,大批高校分數上漲,學生很無奈

2025江蘇高考提前批投檔線公布,大批高校分數上漲,學生很無奈

凱旋學長
2025-07-08 16:59:14
1979年3月5日,得知中國宣布撤軍,六神無主的黎筍下達了一個命令

1979年3月5日,得知中國宣布撤軍,六神無主的黎筍下達了一個命令

冰雅憶史
2025-07-05 15:40:47
金毛被打死后續:餐館被圍老板以死威脅,官方介入,自愿達成協議

金毛被打死后續:餐館被圍老板以死威脅,官方介入,自愿達成協議

水泥土的搞笑
2025-07-08 02:47:59
“輕度抑郁”的人,多半會有這四句口頭禪,希望你一句都沒說過

“輕度抑郁”的人,多半會有這四句口頭禪,希望你一句都沒說過

詩詞中國
2025-07-08 14:51:21
當年郭晶晶奪冠后是這樣子訪港的,難怪霍家大公子挪不開眼睛了

當年郭晶晶奪冠后是這樣子訪港的,難怪霍家大公子挪不開眼睛了

火之文
2025-07-08 17:13:22
印媒發文:為何印度鄰國投入中國懷抱,為什么中國在贏得競賽?

印媒發文:為何印度鄰國投入中國懷抱,為什么中國在贏得競賽?

朗威談星座
2025-07-09 04:29:14
剛與美達成協議,越南就向中國發難,要用中國的錢補自己的窟窿

剛與美達成協議,越南就向中國發難,要用中國的錢補自己的窟窿

三農老歷
2025-07-08 13:02:53
張柏芝罕見曬出小兒子,側臉看起來像哥哥,這么多年生父依舊成謎

張柏芝罕見曬出小兒子,側臉看起來像哥哥,這么多年生父依舊成謎

動物奇奇怪怪
2025-07-07 15:00:32
076兩棲攻擊航母即將海試?甲板上首次掛出滿旗,彈射擋焰板豎起

076兩棲攻擊航母即將海試?甲板上首次掛出滿旗,彈射擋焰板豎起

動漫里的童話
2025-07-09 00:08:41
42歲蒼井空老師紅色性感裙子亮相,童顏巨乳,少女感滿滿

42歲蒼井空老師紅色性感裙子亮相,童顏巨乳,少女感滿滿

說真話的小陳
2025-06-25 09:25:05
“我們才不要你的238億遺產”,邵逸夫離世,4個子女不送終不繼承

“我們才不要你的238億遺產”,邵逸夫離世,4個子女不送終不繼承

聚合大娛
2025-05-08 11:55:09
史上最強55號秀!布朗尼戰弗拉格門票比西決貴600元!誰不想看?

史上最強55號秀!布朗尼戰弗拉格門票比西決貴600元!誰不想看?

嘴炮體壇
2025-07-09 00:52:27
央視曝光殲35生產線,一組鏡頭中居然出現5架

央視曝光殲35生產線,一組鏡頭中居然出現5架

三叔的裝備空間
2025-07-08 12:31:23
超值!6370萬歐元殺星戰舊主38分鐘2球不慶祝,創62年歷史神跡

超值!6370萬歐元殺星戰舊主38分鐘2球不慶祝,創62年歷史神跡

橙汁的味道123
2025-07-09 05:36:33
2025-07-09 05:47:00
劃重點KeyPoints incentive-icons
劃重點KeyPoints
追蹤全球AI科技,記錄中國硬核崛起
45文章數 10關注度
往期回顧 全部

科技要聞

余承東回應開車"睡覺":平生第一次去自首

頭條要聞

媒體談幼兒園血鉛事件:嚴懲到底才能避免事故重演

頭條要聞

媒體談幼兒園血鉛事件:嚴懲到底才能避免事故重演

體育要聞

17歲的朱正很好,但他救不了中國男籃

娛樂要聞

麻煩大了,鳳凰傳奇再次遭受“重創”

財經要聞

新消費浪潮下的資本敘事能持續嗎?

汽車要聞

遵循“極簡主義” 北京現代ELEXIO發布內飾官圖

態度原創

健康
教育
手機
房產
時尚

呼吸科專家破解呼吸道九大謠言!

教育要聞

TTS新傳論文帶讀:【拒絕溝】理解數字鴻溝的新維度!!!

手機要聞

蘋果全新自研 Wi-Fi 和藍牙芯片 Proxima 現身 iOS 18 代碼

房產要聞

突然爆發!巨頭瘋入??谖骱0?!

顯瘦的夏日通勤搭配,復古又時髦!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 忻城县| 高平市| 肇庆市| 延吉市| 广南县| 新蔡县| 名山县| 辛集市| 紫云| 宁阳县| 平原县| 玉门市| 于田县| 铜川市| 祁阳县| 隆昌县| 纳雍县| 宁都县| 北辰区| 永川市| 临朐县| 鸡西市| 丽水市| 武平县| 新民市| 湟中县| 桐梓县| 德兴市| 涿州市| 石棉县| 锡林郭勒盟| 腾冲县| 乐陵市| 贡山| 永胜县| 安图县| 射洪县| 常州市| 镇巴县| 五河县| 吴旗县|