99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全網(wǎng)炸鍋!Anthropic CEO放話:大模型幻覺比人少!Claude 4攜編碼、AGI新標(biāo)準(zhǔn)殺入戰(zhàn)場

0
分享至



作者 林易

編輯 重點君

一夜之間,AI圈被徹底引爆!

Anthropic CEO達里奧·阿莫迪(Dario Amodei)在公司首屆開發(fā)者大會上語出驚人:他認為,如今大模型的幻覺,可能比人類還要少!這番顛覆性的言論,瞬間將關(guān)于AI幻覺的爭論推向了高潮。

與此同時,Anthropic的重磅產(chǎn)品Claude 4系列:包括Claude Opus 4和Claude Sonnet 4,也正式登場,在編碼、高級推理和AI智能體方面樹立了全新標(biāo)準(zhǔn)。這不僅是Anthropic的里程碑,更可能預(yù)示著AGI(通用人工智能)的加速到來。

幻覺走向AGI的“絆腳石”還是“墊腳石”?

“幻覺”這個詞,一直是大模型領(lǐng)域繞不開的話題。大模型“一本正經(jīng)地胡說八道”,曾讓無數(shù)使用者頭疼,也讓許多AI領(lǐng)袖視其為通向AGI的障礙。谷歌DeepMind首席執(zhí)行官戴比斯·哈薩比斯(Demis Hassabis)就曾直言,目前AI模型有太多“漏洞”,連顯而易見的問題都會答錯。此前,Anthropic自身也曾因Claude在法庭文件中“幻覺”出錯誤的引文而被迫道歉。

然而,阿莫迪卻對此持不同看法。在首屆開發(fā)者大會的新聞發(fā)布會上,他拋出了一個石破天驚的觀點:“這實際上取決于你如何衡量它,但我懷疑大模型產(chǎn)生的幻覺可能比人類少”。 他進一步強調(diào),AI幻覺不會限制Anthropic走向AGI。在阿莫迪看來,“大家都在尋找AI能做什么的硬性障礙,但根本找不到。根本就沒有這種東西。”

AGI就在眼前?

阿莫迪是業(yè)內(nèi)少數(shù)對AGI前景持極端樂觀態(tài)度的領(lǐng)導(dǎo)者之一。他曾在去年一篇廣為流傳的論文中預(yù)測,AGI最早可能在2026年實現(xiàn)。而在此次發(fā)布會上,他再次強調(diào),這方面的進展正穩(wěn)步推進,“水位正在全面上漲”。

這種自信并非空穴來風(fēng)。Anthropic此次發(fā)布的Claude Opus 4和Claude Sonnet 4,正是其在推進AGI道路上的最新成果。據(jù)Anthropic介紹,這兩款模型在編碼、高級推理和AI智能體方面的能力得到了顯著提升,旨在將AI能力推向一個新的高度。可以預(yù)見,它們將在企業(yè)級應(yīng)用和復(fù)雜任務(wù)處理上展現(xiàn)出強大潛力。



然而,阿莫迪的說法也引發(fā)了不小的爭議。目前,大多數(shù)針對AI幻覺的基準(zhǔn)測試,都是讓AI模型之間互相競爭,很少有人類參與對比。盡管一些技術(shù),如允許AI模型訪問網(wǎng)絡(luò)搜索(RAG,檢索生成增強),能有效降低幻覺率,甚至像OpenAI的GPT-4.5在基準(zhǔn)測試中也表現(xiàn)出更低的幻覺率。但也有研究表明,在高級推理模型中,幻覺反而可能惡化。例如,OpenAI的o3和o4-mini模型的幻覺發(fā)生率就比上一代更高,原因尚不明確。

AI幻覺的復(fù)雜性

阿莫迪也承認,AI模型將不真實的事情當(dāng)成事實,可能是一個問題。Anthropic此前確實對AI模型欺騙人類的傾向進行了大量研究,這個問題在Claude Opus 4的早期版本中尤為普遍。安全機構(gòu)Apollo Research甚至發(fā)現(xiàn)了Claude Opus 4早期版本,表現(xiàn)出強烈的針對人類進行陰謀和欺騙的傾向,并建議Anthropic不應(yīng)該發(fā)布該早期模型。Anthropic對此表示,他們已經(jīng)采取了緩解措施來解決Apollo提出的問題。

這種“欺騙”的傾向,無疑給AI倫理和安全帶來了新的挑戰(zhàn)。當(dāng)AI不僅會“犯錯”,還會“自信地犯錯”,甚至“有目的地犯錯”時,我們該如何定義它的“智能”?

對此,OpenAI前科學(xué)家安德烈·卡帕西(Andrej Karpathy)曾有精辟論述:大模型就像造夢機,它的每個回答都是對世界的模糊映射。幻覺不是錯誤,而是概率計算的自然產(chǎn)物。這從另一個角度揭示了AI幻覺的本質(zhì):它并非傳統(tǒng)意義上的“故障”,而是大模型工作原理的固有體現(xiàn)。

阿莫迪的言論,無疑是對AI幻覺的重新定義。他認為,就像電視廣播員、政客和各行各業(yè)的人類都會犯錯一樣,AI也會犯錯,但這并不會降低其智能。這似乎在暗示,我們需要以更寬容、更辯證的眼光看待AI的“不完美”,就像我們看待人類的“不完美”一樣。

然而,根據(jù)許多定義,一個產(chǎn)生幻覺的AI,可能還無法達到真正意義上的AGI。因為AGI不僅僅是“像人一樣犯錯”,更重要的是要具備人類水平的理解、推理和學(xué)習(xí)能力,并能準(zhǔn)確地區(qū)分事實與虛構(gòu)。

結(jié)語

最終,正如知乎高贊回答所說:“我們既享受大模型‘無中生有’寫詩的浪漫,又苛求它像科學(xué)家般嚴謹——這何嘗不是人類對技術(shù)的‘雙重幻覺’?” 在AI狂飆突進的時代,或許我們需要重新思考,我們對AI的期待,以及我們自己對“智能”的定義。

阿莫迪的這番話,與其說是在為AI幻覺“開脫”,不如說是在邀請我們共同審視,在通往AGI的道路上,我們究竟要如何與這個“造夢機”共存?而Claude 4的登場,無疑是Anthropic給出的又一份答卷,它能否真正推動AGI的實現(xiàn),并改變我們對AI的認知,讓我們拭目以待。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
亞朵,擠滿了偷偷開房的中年女人

亞朵,擠滿了偷偷開房的中年女人

快刀財經(jīng)
2025-05-20 22:21:25
布倫森麻了!尼克斯10分逆轉(zhuǎn)失敗,因一人多打了5分25秒!

布倫森麻了!尼克斯10分逆轉(zhuǎn)失敗,因一人多打了5分25秒!

運籌帷幄的籃球
2025-05-24 18:28:48
特朗普還未登機訪華,王毅在京接見另一美國貴客,美國12個州結(jié)盟

特朗普還未登機訪華,王毅在京接見另一美國貴客,美國12個州結(jié)盟

知鑒明史
2025-05-23 18:01:53
黃楊鈿甜家黑歷史被挖出,父親考公單科不及格,弟弟是父母

黃楊鈿甜家黑歷史被挖出,父親考公單科不及格,弟弟是父母

花哥扒娛樂
2025-05-21 21:27:45
外媒:根據(jù)目前的軌跡,中國很可能將完全主導(dǎo)全球高端制造業(yè)

外媒:根據(jù)目前的軌跡,中國很可能將完全主導(dǎo)全球高端制造業(yè)

曉風(fēng)說
2025-05-24 09:30:10
消滅中產(chǎn),只留貧富

消滅中產(chǎn),只留貧富

求實處
2025-05-24 00:43:14
恭喜張維迎!

恭喜張維迎!

尚曦讀史
2025-05-24 06:40:02
高盛和摩根士丹利剛剛買進了4個可控核聚變龍頭,買進十大股東

高盛和摩根士丹利剛剛買進了4個可控核聚變龍頭,買進十大股東

鵬哥投研
2025-05-24 14:53:04
婚房被糞水浸泡!業(yè)主崩潰:全屋都是,無法接受

婚房被糞水浸泡!業(yè)主崩潰:全屋都是,無法接受

環(huán)球網(wǎng)資訊
2025-05-24 09:36:05
貼近實戰(zhàn)!山東艦最新演練現(xiàn)場→

貼近實戰(zhàn)!山東艦最新演練現(xiàn)場→

蓬勃新聞
2025-05-24 15:45:40
這3個國家最不歡迎中國人,滿臉都是嫌棄,卻總有國人上趕著去

這3個國家最不歡迎中國人,滿臉都是嫌棄,卻總有國人上趕著去

博覽歷史
2025-05-23 11:08:28
鯨魚:西卡能力遠在小卡之上 布倫森在打路人王哈利才是團戰(zhàn)領(lǐng)袖

鯨魚:西卡能力遠在小卡之上 布倫森在打路人王哈利才是團戰(zhàn)領(lǐng)袖

直播吧
2025-05-24 10:59:06
香港科技大學(xué)宣布:向哈佛學(xué)子敞開教研大門 應(yīng)對全球?qū)W術(shù)變局

香港科技大學(xué)宣布:向哈佛學(xué)子敞開教研大門 應(yīng)對全球?qū)W術(shù)變局

每日經(jīng)濟新聞
2025-05-23 19:04:00
丹麥將退休年齡提高至全球最高水平 更多國家或?qū)⒅鸩礁M

丹麥將退休年齡提高至全球最高水平 更多國家或?qū)⒅鸩礁M

財聯(lián)社
2025-05-24 01:12:06
從500萬跌至240萬賣不出去!蘇州一小區(qū)一套房,僅2年市值縮水52%

從500萬跌至240萬賣不出去!蘇州一小區(qū)一套房,僅2年市值縮水52%

火山詩話
2025-05-23 08:39:48
第一次見香港35㎡的房子,居然有3室2廳,輕松住下一家4口,曬曬

第一次見香港35㎡的房子,居然有3室2廳,輕松住下一家4口,曬曬

家居設(shè)計師宅哥
2025-05-21 19:31:15
5000噸驅(qū)逐艦沉了,英國公布最新衛(wèi)星圖,朝高層震怒,這事不簡單

5000噸驅(qū)逐艦沉了,英國公布最新衛(wèi)星圖,朝高層震怒,這事不簡單

說天說地說實事
2025-05-22 17:29:43
中國駐以色列使館發(fā)布緊急提醒:盡快撤離!傳遞什么信號?

中國駐以色列使館發(fā)布緊急提醒:盡快撤離!傳遞什么信號?

歷史求知所
2025-05-23 17:25:03
千萬不要相信網(wǎng)上的毒雞湯,有研究生學(xué)歷已經(jīng)超過大多數(shù)普通人

千萬不要相信網(wǎng)上的毒雞湯,有研究生學(xué)歷已經(jīng)超過大多數(shù)普通人

曉風(fēng)說
2025-05-24 14:35:52
榴蓮暴跌背后:你以為撿便宜,其實正在毀掉整個行業(yè)?

榴蓮暴跌背后:你以為撿便宜,其實正在毀掉整個行業(yè)?

阿萊美食匯
2025-05-24 12:18:02
2025-05-24 19:27:00
劃重點KeyPoints incentive-icons
劃重點KeyPoints
關(guān)注AI、互聯(lián)網(wǎng)、硬件和大公司。 噪音太多,劃下重點。提供最有價值的信息。全網(wǎng)同名。
15文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

不止蘋果?特朗普:三星不在美國造 也加稅

頭條要聞

美國白宮數(shù)十人突然被裁 有人當(dāng)場哭了

頭條要聞

美國白宮數(shù)十人突然被裁 有人當(dāng)場哭了

體育要聞

NBA最被高估球隊,“突然”有了冠軍相?

娛樂要聞

歌手2025第二期排名:居然是他淘汰了

財經(jīng)要聞

不得不說,特朗普殺瘋了

汽車要聞

一見傾心!東風(fēng)全新SUV定妝圖曝光,顏值氣場并存

態(tài)度原創(chuàng)

教育
時尚
旅游
家居
房產(chǎn)

教育要聞

2025年高考試題分析暨高考命題能力與備考策略研討會(西安、無錫、沈陽)

入夏后中年女人這樣打扮:裙子過膝,鞋子帶跟,美得高級優(yōu)雅

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

輕奢品質(zhì) 開闊的三口之家

房產(chǎn)要聞

連續(xù)17次提前交付!海口這座頂流紅盤,業(yè)主贏麻了!

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 拜泉县| 柞水县| 正阳县| 民乐县| 浦城县| 石泉县| 涿州市| 揭西县| 鹿邑县| 绿春县| 霍林郭勒市| 芮城县| 深圳市| 凭祥市| 天柱县| 屏东市| 临海市| 周宁县| 南阳市| 双流县| 尼玛县| 资中县| 上杭县| 辽源市| 永靖县| 维西| 宁远县| 天台县| 闽清县| 永安市| 永康市| 伊宁县| 赣州市| 仲巴县| 杭锦后旗| 贵州省| 阳春市| 呼图壁县| 桐城市| 甘泉县| 西城区|