99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

模型越新幻覺越重!AI幻覺扣住產業發展命脈

0
分享至

自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構信息當作真實事實輸出。實際上,“幻覺”這一表述相當委婉,它實則暴露出AI的核心缺陷——當前的大語言模型尚未達到真正意義上的智能水平。



就在上個月,編程工具Cursor引發一場風波。用戶收到消息稱,其使用政策將進行調整,未來僅支持在單臺電腦上使用。然而,這條消息很快被證實為假。Cursor首席執行官兼聯合創始人Michael Truell迅速出面澄清:“我們并未制定類似政策,用戶完全可以在多臺設備上使用Cursor。這一錯誤信息源于一線AI機器人的錯誤回復。”

此次事件不僅讓用戶虛驚一場,更直觀展現了人工智能系統的不穩定。

幻覺成為AI進化的攔路虎

經過數年發展,盡管AI技術在諸多領域取得突破,但在判斷信息真假時仍不盡如人意。即使是OpenAI、谷歌、DeepSeek等行業頭部機構研發的模型也存在許多錯誤輸出。

值得警惕的是,這些錯誤并未隨著時間推移而減少,反而呈現增多趨勢。誠然,AI在數學運算、編程領域有所提升,但在處理復雜事實性信息時依然存在明顯短板,難以滿足用戶需求。

今天的AI實際上是根據“復雜數學系統”構建的,它們通過不斷分析海量數字數據,持續優化自身性能。然而,算法系統始終存在一個根本性缺陷——無法有效區分信息真假。在一項測試中,相較于舊版AI系統,新版AI系統的“幻覺率”竟然更高,這說明AI面臨嚴峻挑戰。

Vectara專注于企業級AI工具開發,其首席執行官Amr Awadallah直言:“盡管我們傾盡全力,可‘幻覺’問題還是存在,它并沒有消失。”現狀表明,即便在專業團隊的持續攻堅下,AI“幻覺”依然是難以攻克的技術頑疾。

Okahu致力于解決AI“幻覺”問題,其首席執行官Pratik Verma也指出:“判斷AI回應是事實還是虛假需要耗費大量時間。如果不能妥善處理這些錯誤,就無法保證人工智能系統發揮應有價值,畢竟這些系統的設計初衷是幫助用戶自動完成各項任務。”

AI企業并非不清楚“幻覺”問題的存在,它們付出了巨大努力,但始終無法有效解決這一難題。OpenAI的內部測試顯示,相比老系統,它所開發的新系統“幻覺率”反而更高。

在PersonQA標準測試中,o3模型在33%的回答中產生幻覺,幾乎是o1模型(16%)的兩倍,而最新的o4-mini模型表現更差,“幻覺率”高達48%。若采用SimpleQA標準測試,情況同樣不容樂觀。o3和o4-mini的“幻覺率”分別達到51%和79%,o1模型的“幻覺率”也有44%。

OpenAI指出,AI系統從海量數據中學習,數據量之巨遠超人類專家的理解能力,因此很難確定問題根源究竟在哪里。

人類恐怕不能解決AI幻覺

華盛頓大學及艾倫人工智能研究所研究人員Hannaneh Hajishirzi表示,他們找到一種新方法,能夠追溯AI特定行為在訓練數據中的源頭。但由于系統學習的數據量過于龐大,新工具無法解釋所有情況。Hannaneh Hajishirzi坦言:“我們仍然搞不清這些模型到底是如何運行的。”

Vectara近年來持續對AI系統展開測試,通過讓系統總結新聞內容的方式,觀察“幻覺率”的變化情況。然而,測試結果令人沮喪——“幻覺率”不僅未降低,反而呈上升趨勢。

長期以來,OpenAI認定一個理念:向AI投喂的數據越多,AI就會越聰明。但如今,AI在訓練時幾乎耗盡所有互聯網英文信息,它的幻覺卻愈發嚴重。這一現實表明,若想突破“幻覺”困境必須探尋新的技術路徑。

當前,工程師們開始倚重“強化學習”技術。在數學、編程等領域,強化學習確實能通過試錯機制實現學習與進步,但在部分領域,該技術仍未帶來明顯改善。

此外,推理模型在解答復雜問題時會先進行“思考”,采用分步解決的策略。然而,每個思考步驟都潛藏著產生“幻覺”的風險,思考步驟越多,累積的錯誤也就越多,這無疑給提升AI信息準確性帶來更大挑戰。

如今的AI能夠展示思考過程,使用戶可以看到錯誤產生的環節,這無疑是技術層面的一大進步。然而研究人員發現,AI所展示的思考步驟可能與最終答案毫無關聯。Anthropic研究人員Aryo Pradipta Gema直言:“AI系統聲稱自己正在思考,但它的思考有時并無必要。”

一些研究人員甚至認為,杜絕AI“幻覺”不可能實現,只能通過多種方法降低“幻覺率”。比如讓AI直面自身知識盲區,主動向用戶承認“我不知道”;引入“檢索增強生成”技術,促使AI通過檢索相關文檔輔助作答,而非單純依賴記憶數據直接輸出答案。

美國東北大學體驗式人工智能研究所研究人員Usama Fayyad提出,“幻覺”這一表述存在概念偏差,它過度擬人化。Usama Fayyad強調,AI生成錯誤信息與人類產生幻覺存在本質差異——AI既無意圖,也無意識,應避免用帶有情感色彩的詞匯模糊技術本質。(小刀)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
知名餐飲突然宣布:又一家店,停業!已關閉18家門店

知名餐飲突然宣布:又一家店,停業!已關閉18家門店

魯中晨報
2025-05-29 09:33:43
中聯部部長助理趙世通出任國臺辦副主任

中聯部部長助理趙世通出任國臺辦副主任

澎湃新聞
2025-05-29 17:58:27
知名主持人朱迅在甘孜折多山救治高反游客,當地文旅局工作人員:她給女游客吸氧還幫忙按摩穴位

知名主持人朱迅在甘孜折多山救治高反游客,當地文旅局工作人員:她給女游客吸氧還幫忙按摩穴位

極目新聞
2025-05-29 16:52:59
滿面長痘痘覺得好丟臉不想見人,怎么解決?

滿面長痘痘覺得好丟臉不想見人,怎么解決?

益藥健康
2025-05-27 10:58:20
視覺派輔助駕駛挑戰“夜”“雨”“霧”,沒有激光雷達行不行?

視覺派輔助駕駛挑戰“夜”“雨”“霧”,沒有激光雷達行不行?

Autolab
2025-05-28 19:28:04
悲催!網傳去年微軟蘇州裁員去西雅圖的員工,現全部被裁且0賠償

悲催!網傳去年微軟蘇州裁員去西雅圖的員工,現全部被裁且0賠償

火山詩話
2025-05-29 07:24:26
“將數據從一臺計算機傳輸到另一臺,竟然需要先打印出來!”馬斯克:工作重點從裁員轉向政府電腦系統

“將數據從一臺計算機傳輸到另一臺,竟然需要先打印出來!”馬斯克:工作重點從裁員轉向政府電腦系統

第一財經資訊
2025-05-28 20:14:39
明明他們可以明搶,但還是給出了理由!

明明他們可以明搶,但還是給出了理由!

胖胖說他不胖
2025-05-29 16:37:41
《色即是空》女主河智苑被偶遇,身材好到爆人又漂亮,46歲如少女

《色即是空》女主河智苑被偶遇,身材好到爆人又漂亮,46歲如少女

叨嘮
2025-05-28 19:42:24
三權分立戰勝川普 美聯邦法院讓關稅歸零

三權分立戰勝川普 美聯邦法院讓關稅歸零

凱利經濟觀察
2025-05-29 12:09:08
孫繼海青訓風波女主:兒子是主力+愿賠5萬 家里僅丈夫跑滴滴賺錢

孫繼海青訓風波女主:兒子是主力+愿賠5萬 家里僅丈夫跑滴滴賺錢

風過鄉
2025-05-29 12:48:45
周琦談教練處理與球員關系:就是怕那種半吊子,完了還想當祖師爺

周琦談教練處理與球員關系:就是怕那種半吊子,完了還想當祖師爺

懂球帝
2025-05-29 14:26:33
美國終于動手,27萬中國學生,將被陸續遣返,中方警告兩大后果

美國終于動手,27萬中國學生,將被陸續遣返,中方警告兩大后果

阿傖說事
2025-05-29 16:03:16
國防部:美國“金穹”系統將打開潘多拉魔盒

國防部:美國“金穹”系統將打開潘多拉魔盒

界面新聞
2025-05-29 15:56:39
突發!確認墜機

突發!確認墜機

浙江之聲
2025-05-29 15:10:37
剛剛!黃金跳水,美股指期貨直線暴漲!關稅措施被叫停,最新消息:特朗普政府已經提出上訴

剛剛!黃金跳水,美股指期貨直線暴漲!關稅措施被叫停,最新消息:特朗普政府已經提出上訴

每日經濟新聞
2025-05-29 08:50:05
風向變了?夏立言訪陸稱兩岸都是中國人,馬英九稱賴清德不想打仗

風向變了?夏立言訪陸稱兩岸都是中國人,馬英九稱賴清德不想打仗

時時有聊
2025-05-29 10:10:22
沈陽被劃到“二線城市”!你怎么看?

沈陽被劃到“二線城市”!你怎么看?

沈陽生活圈i
2025-05-29 10:51:40
深圳男子買彩票中2億,6天后去兌獎,卻被工作人員趕了出去

深圳男子買彩票中2億,6天后去兌獎,卻被工作人員趕了出去

今天說故事
2025-05-28 14:49:59
烏克蘭使用彈道導彈對俄發起第7輪空襲,莫斯科市民工人四散奔逃

烏克蘭使用彈道導彈對俄發起第7輪空襲,莫斯科市民工人四散奔逃

史政先鋒
2025-05-29 10:30:08
2025-05-29 18:07:00
極客網 incentive-icons
極客網
科技使能新商業
2477文章數 2554關注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

消息稱印度獲得未爆炸的中國研制空空導彈 國防部回應

頭條要聞

消息稱印度獲得未爆炸的中國研制空空導彈 國防部回應

體育要聞

納達爾,法網,漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發生了

財經要聞

美聯邦法院阻止特朗普4月2日關稅政策生效

汽車要聞

搭載Thor芯片 領克900城市NOA挑戰重慶

態度原創

數碼
親子
教育
公開課
軍事航空

數碼要聞

折疊屏快被華為玩出花了:一款華為折疊平板正在籌備

親子要聞

生孩子就是為了玩,孩子好好睡覺,被爸爸各種逗弄太好玩了!

教育要聞

@全體高考生:這個應急錦囊,非常重要!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以軍承認使用激光武器攔截無人機

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宿州市| 萍乡市| 永定县| 合作市| 安康市| 湖北省| 安庆市| 济宁市| 大化| 海兴县| 陇川县| 高雄市| 泊头市| 苍梧县| 唐山市| 招远市| 神池县| 罗源县| 同心县| 轮台县| 阜新市| 蒙阴县| 冀州市| 宿迁市| 上犹县| 西平县| 六盘水市| 盖州市| 陵水| 仁布县| 清苑县| 桦甸市| 宣化县| 工布江达县| 镇宁| 株洲市| 肥东县| 安义县| 新和县| 凌云县| 蒙城县|