99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

LeCun團隊揭示LLM語義壓縮本質(zhì):極致統(tǒng)計壓縮犧牲細節(jié)

0
分享至


來源:量子位 | 公眾號 QbitAI

時令 發(fā)自 凹非寺

當我們讀到“蘋果”“香蕉”“西瓜”這些詞,雖然顏色不同、形狀不同、味道也不同,但仍會下意識地歸為“水果”。

哪怕是第一次見到“火龍果”這個詞,也能憑借語義線索判斷它大概也是一種水果。

這種能力被稱為語義壓縮,它讓我們能夠高效地組織知識、迅速地對世界進行分類。

那問題來了:大型語言模型(LLM)雖然語言能力驚人,但它們在語義壓縮方面能做出和人類一樣的權衡嗎?

為探討這一問題,圖靈獎得主LeCun團隊,提出了一種全新的信息論框架。

該框架通過對比人類與LLM在語義壓縮中的策略,揭示了兩者在壓縮效率與語義保真之間的根本差異:

LLM偏向極致的統(tǒng)計壓縮,而人類更重細節(jié)與語境。


語義壓縮對比框架

要實證性地研究LLM的表征方式與人類概念結構之間的關系,需要兩個關鍵要素:

穩(wěn)健的人類概念分類基準

研究團隊基于認知科學中的三項經(jīng)典研究(Rosch 1973、1975和McCloskey & Glucksberg 1978),構建了一個涵蓋1049個項目、34個語義類別的統(tǒng)一基準。

這些數(shù)據(jù)不僅提供了類別歸屬信息,還包含人類對各項目“典型性”的評分,反映了人類認知中概念形成的深層結構。

相比現(xiàn)代眾包數(shù)據(jù),這些經(jīng)過專家嚴格設計的數(shù)據(jù)集更具可信度與解釋力,為LLM的類人性評估提供了高保真的比較基礎。

多樣化的LLM模型選擇

為全面評估不同大型語言模型在概念表征上的差異,研究團隊選取了30+LLMs(BERT、LlamA、Gemma、Qwen等),參數(shù)規(guī)模從3億到720億不等。

所有模型均從輸入嵌入層提取靜態(tài)詞元表示,以貼近人類分類實驗中“去上下文”的刺激方式,確保模型和人類的認知基準保持一致,便于公平比較。

為分析LLM與人類在表達和組織語義信息時的差異,研究引入了一個信息論框架。

該框架借鑒了兩大經(jīng)典信息論原理:

  • 速率失真理論:描述壓縮效率與信息失真之間的最優(yōu)權衡;

  • 信息瓶頸原理:關注在壓縮表示的同時,最大程度保留與目標相關的信息。

LLM與人類在表征策略上的關鍵差異

研究發(fā)現(xiàn),LLM的概念分類結果與人類語義分類的對齊程度顯著高于隨機水平。

這一結果驗證了LLM在語義組織方面的基本能力,并為后續(xù)更細粒度的語義結構對比奠定了基礎。


但是大型語言模型真的理解細節(jié)嗎?

答案是:LLM難以處理細粒度的語義差異。它們的內(nèi)部概念結構與人類對類別歸屬的直覺不相符。


人類典型性判斷與LLM余弦相似度之間的斯皮爾曼相關系數(shù)較弱且大多數(shù)不顯著,表明兩者在概念表征結構上存在差異。

那LLM和人類在信息壓縮與語義保真上存在哪些關鍵差異呢?

LLM側(cè)重于統(tǒng)計壓縮,力求最大程度地減少冗余信息;而人類則更注重適應性和豐富性,強調(diào)保持靈活性和上下文的完整性。


研究團隊

這項研究由斯坦福大學與紐約大學聯(lián)合開展,團隊成員均來自這兩所高校。

其中,第一作者為斯坦福大學博士后研究員Chen Shani。


更讓網(wǎng)友震驚的的是,Yann LeCun也為此研究的作者之一。



Yann LeCun是當今人工智能領域最具影響力的科學家之一,現(xiàn)任 Meta(原 Facebook)首席人工智能科學家,同時也是紐約大學教授。

LeCun早在1980年代便開始研究神經(jīng)網(wǎng)絡,最著名的貢獻是提出了卷積神經(jīng)網(wǎng)絡(CNN)的核心架構——LeNet-5,用于手寫數(shù)字識別。

該網(wǎng)絡是現(xiàn)代深度學習模型的雛形,為后續(xù)圖像識別和計算機視覺技術的發(fā)展奠定了堅實基礎。

他與Geoffrey Hinton、Yoshua Bengio被譽為“深度學習三巨頭”,共同推動了深度學習的理論與應用突破。

2018年,三人因在深度學習領域的杰出貢獻,榮獲了計算機科學領域的最高獎項——圖靈獎。

除了技術創(chuàng)新,LeCun還積極推動深度學習技術在工業(yè)界的應用,尤其是在Meta,領導團隊將人工智能技術應用于大規(guī)模系統(tǒng)。

他同時是自監(jiān)督學習的積極倡導者,認為這是實現(xiàn)通用人工智能(AGI)的關鍵路徑之一。

可以說,LeCun的研究對人工智能技術的演進產(chǎn)生了重要影響。

論文地址:https://arxiv.org/abs/2505.17117
參考鏈接:

https://x.com/ziv_ravid/status/1928118800139841760

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
東北大學遇難學生家屬發(fā)聲,其中一位學生姐姐透露弟弟去世后模樣

東北大學遇難學生家屬發(fā)聲,其中一位學生姐姐透露弟弟去世后模樣

振華觀史
2025-07-25 16:34:19
汪蘇瀧不忍了!旺仔小喬四年前一句話,張碧晨痛失《年輪》演唱權

汪蘇瀧不忍了!旺仔小喬四年前一句話,張碧晨痛失《年輪》演唱權

云間娛樂
2025-07-25 15:34:44
陜西這件事,每個字都寫滿了諷刺

陜西這件事,每個字都寫滿了諷刺

清書先生
2025-07-25 18:11:26
中南大學職工花5000元嫖娼:完成交易,拿女方床照威脅,索要嫖資

中南大學職工花5000元嫖娼:完成交易,拿女方床照威脅,索要嫖資

娜烏和西卡
2025-07-25 10:26:46
九連勝無壓力!樊振東橫掃李天陽,全場完美壓制,太輕松了!

九連勝無壓力!樊振東橫掃李天陽,全場完美壓制,太輕松了!

籃球資訊達人
2025-07-25 19:24:20
DeepSeek月均下載量暴跌72.2%!周鴻祎:梁文鋒不屑于做APP,他把技術全都開源免費【附大模型行業(yè)市場分析】

DeepSeek月均下載量暴跌72.2%!周鴻祎:梁文鋒不屑于做APP,他把技術全都開源免費【附大模型行業(yè)市場分析】

前瞻網(wǎng)
2025-07-25 09:17:51
細節(jié)披露:6名大學生溺亡事故獲救老師照片公布,重傷截肢消息不實

細節(jié)披露:6名大學生溺亡事故獲救老師照片公布,重傷截肢消息不實

上觀新聞
2025-07-25 10:02:38
觸目驚心!境外論壇偷拍大量中國女性!妻子女兒母親全成意淫對象

觸目驚心!境外論壇偷拍大量中國女性!妻子女兒母親全成意淫對象

派大星紀錄片
2025-07-25 10:26:14
中國銀行業(yè)協(xié)會原黨委委員、秘書長黃潤中被開除黨籍

中國銀行業(yè)協(xié)會原黨委委員、秘書長黃潤中被開除黨籍

澎湃新聞
2025-07-25 19:34:26
女子面試被打后續(xù):多處骨折,更多受害者發(fā)聲,打人只是冰山一角

女子面試被打后續(xù):多處骨折,更多受害者發(fā)聲,打人只是冰山一角

削桐作琴
2025-07-25 12:48:07
面試被打后續(xù):警方出手,更多受害者站出來,老板身份越扒越可怕

面試被打后續(xù):警方出手,更多受害者站出來,老板身份越扒越可怕

通鑒史智
2025-07-25 18:29:27
澤連斯基做出讓步,烏克蘭人值得擁有最好的

澤連斯基做出讓步,烏克蘭人值得擁有最好的

山河路口
2025-07-25 12:56:51
2年2820萬!侮辱性報價!場均24+3+3就給這點?籃網(wǎng)欺負人

2年2820萬!侮辱性報價!場均24+3+3就給這點?籃網(wǎng)欺負人

鬼魅突破上籃
2025-07-26 01:20:00
PPT戰(zhàn)神集體翻車,智駕測試憑什么特斯拉拿第一

PPT戰(zhàn)神集體翻車,智駕測試憑什么特斯拉拿第一

汽扯扒談
2025-07-25 11:52:18
懂車帝測試各方反應:有人曬,有人不想說話,有人沉默是今晚的康橋

懂車帝測試各方反應:有人曬,有人不想說話,有人沉默是今晚的康橋

三言科技
2025-07-25 19:01:41
偷雞不成蝕把米!這一次,張碧晨被汪蘇瀧光速打臉,體面碎了一地

偷雞不成蝕把米!這一次,張碧晨被汪蘇瀧光速打臉,體面碎了一地

林輕吟
2025-07-25 19:47:47
請給北京日報帶個話,死了的學生情緒更穩(wěn)定

請給北京日報帶個話,死了的學生情緒更穩(wěn)定

李宇琛
2025-07-25 20:50:23
洪森司令部暴露秘密,大批柬軍陣亡:多種中美制坦克火箭炮大混戰(zhàn)

洪森司令部暴露秘密,大批柬軍陣亡:多種中美制坦克火箭炮大混戰(zhàn)

南宮一二
2025-07-25 16:50:07
女子稱在深圳一公司面試時遭毆打致腰椎骨折,警方:已對涉案人員采取強制措施

女子稱在深圳一公司面試時遭毆打致腰椎骨折,警方:已對涉案人員采取強制措施

極目新聞
2025-07-25 16:46:56
獨女身份坐實,宗馥莉王炸證據(jù)公開!

獨女身份坐實,宗馥莉王炸證據(jù)公開!

品牌頭版
2025-07-25 17:55:51
2025-07-26 01:55:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4046文章數(shù) 37239關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經(jīng)要聞

劉煜輝:當下重要不是找確定性而是轉(zhuǎn)折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態(tài)度原創(chuàng)

藝術
手機
數(shù)碼
公開課
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

真把天璣 9400+ 裝在「充電寶」上了?

數(shù)碼要聞

谷歌Pixel Watch 4智能手表曝光:充電口更改,配色更多

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

吳謙少將任中國駐埃及使館國防武官

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 和顺县| 天镇县| 德化县| 卓尼县| 荆门市| 山东省| 饶阳县| 绥阳县| 钟山县| 祁阳县| 深水埗区| 临西县| 绍兴市| 蓝山县| 江华| 锦州市| 桂东县| 化州市| 讷河市| 龙游县| 郴州市| 施秉县| 察雅县| 新安县| 湖南省| 阜平县| 恭城| 丰原市| 黄浦区| 崇义县| 抚远县| 大城县| 都兰县| 得荣县| 托克托县| 喀什市| 同德县| 都江堰市| 原平市| 遵义县| 洪洞县|