99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

神經(jīng)網(wǎng)絡(luò)是否可以被嚴(yán)謹(jǐn)?shù)亟忉屒宄控芩闹辈ァご竽P涂山忉屝宰x書(shū)會(huì)

0
分享至


導(dǎo)語(yǔ)

集智俱樂(lè)部聯(lián)合上海交通大學(xué)副教授張拳石、阿里云大模型可解釋性團(tuán)隊(duì)負(fù)責(zé)人沈旭、彩云科技首席科學(xué)家肖達(dá)、北京師范大學(xué)碩士生楊明哲和浙江大學(xué)博士生姚云志共同發(fā)起。本讀書(shū)會(huì)旨在突破大模型“黑箱”困境,嘗試從不同視角梳理大語(yǔ)言模型可解釋性的科學(xué)方法論。

本期是「大模型可解釋性」讀書(shū)會(huì)的第二次分享,張拳石老師將系統(tǒng)介紹他們針對(duì)大模型可解釋性問(wèn)題提出的等效交互理論,帶你從自上而下的視角思考神經(jīng)網(wǎng)絡(luò)是否可以被嚴(yán)謹(jǐn)?shù)慕忉屒宄看竽P湍軘[脫Scaling Law的桎梏嗎?

分享簡(jiǎn)介

“模型可解釋性的不足”和“Scaling Law的桎梏”是深度學(xué)習(xí)領(lǐng)域中兩大瓶頸性問(wèn)題,但是從內(nèi)在機(jī)理層面卻殊途同歸地指向同一根因——對(duì)模型表征能力缺少根本性解釋與建模。目前大部分可解釋性研究依然停留在工程技術(shù)層面,無(wú)法在機(jī)理層面直接解釋模型表征能力。張拳石團(tuán)隊(duì)所提出的基于等效交互可解釋性理論體系,從機(jī)理層面部分解決了上述問(wèn)題,證明了神經(jīng)網(wǎng)絡(luò)內(nèi)在復(fù)雜表征邏輯可以被嚴(yán)謹(jǐn)且全面地概括為稀疏的交互概念,并基于交互概念可以充分解釋神經(jīng)網(wǎng)絡(luò)的性能根因,從而跳出黑盒訓(xùn)練范式,有針對(duì)性地實(shí)時(shí)監(jiān)控并修復(fù)模型表征缺陷,提升訓(xùn)練和測(cè)試效率,擺脫Scaling Law的桎梏。

分享大綱

深度學(xué)習(xí)的雙重困境

  • Scaling Law 的歷史成就與當(dāng)前瓶頸

  • 可解釋性研究的工程化局限

等效交互理論的核心突破

  • 稀疏交互概念的定義

  • 從神經(jīng)網(wǎng)絡(luò)內(nèi)在復(fù)雜表征邏輯到稀疏交互概念

表征缺陷診斷與修復(fù)技術(shù)

  • 表征缺陷的實(shí)時(shí)監(jiān)控

  • 基于交互概念的干預(yù)策略

超越 Scaling Law 的路徑

  • 小模型的高效訓(xùn)練范式

  • 動(dòng)態(tài)架構(gòu)優(yōu)化與資源分配

核心概念

稀疏交互概念神經(jīng)網(wǎng)絡(luò)中,僅少數(shù)神經(jīng)元組合(交互概念)對(duì)特定任務(wù)起決定性作用。這種稀疏性不僅是模型高效運(yùn)行的基礎(chǔ),更是可解釋性研究的關(guān)鍵切入點(diǎn)。通過(guò)定位這些交互模式,可精準(zhǔn)理解模型決策邏輯。

等效交互可解釋性理論張拳石團(tuán)隊(duì)提出的理論體系,證明神經(jīng)網(wǎng)絡(luò)的復(fù)雜計(jì)算可分解為稀疏概念交互,通過(guò)數(shù)學(xué)建模實(shí)現(xiàn)對(duì)模型行為的機(jī)理級(jí)解釋。該理論突破了傳統(tǒng)可解釋性方法的工程化局限,為模型優(yōu)化提供了直接的理論依據(jù)。

Scaling Law描述模型性能與參數(shù)規(guī)模、數(shù)據(jù)量、計(jì)算資源間關(guān)系的冪律規(guī)律。盡管曾推動(dòng)深度學(xué)習(xí)快速發(fā)展,但其邊際效益遞減趨勢(shì)(如 OpenAI 的 o3 模型)已引發(fā)對(duì)大模型可持續(xù)性的質(zhì)疑。

動(dòng)態(tài)表征修復(fù)基于等效交互理論的實(shí)時(shí)監(jiān)控技術(shù),通過(guò)干預(yù)特定交互概念的激活狀態(tài),可針對(duì)性修復(fù)模型在訓(xùn)練或推理中的表征缺陷,顯著提升泛化能力與魯棒性。

參考文獻(xiàn)

1.證明神經(jīng)網(wǎng)絡(luò)精細(xì)決策邏輯可以嚴(yán)格解釋為符號(hào)化等效交互概念

Qihan Ren, Jiayang Gao, Wen Shen, et al.Where We Have Arrived in Proving the Emergence of Sparse Interaction Primitives in DNNs. International Conference on Learning Representations, 2024


2.從神農(nóng)嘗百草到精煉與萃取:論神經(jīng)網(wǎng)絡(luò)對(duì)抗遷移性

Xin Wang, Jie Ren, Shuyu Lin, et al.A Unified Approach to Interpreting and Boosting Adversarial Transferability. International Conference on Learning Representations, 2020, abs/2010.04055

3.神經(jīng)網(wǎng)絡(luò)的博弈交互解釋性(六):從博弈交互層面解釋對(duì)抗魯棒性

Jie Ren, Die Zhang, Yisen Wang, et al.A Unified Game-Theoretic Interpretation of Adversarial Robustness. arXiv.org, 2021, abs/2111.03536

4.可解釋性:神經(jīng)網(wǎng)絡(luò)對(duì)交互概念表達(dá)能力的解析分析

Dongrui Liu, Huiqi Deng, Xu Cheng, et al.Towards the Difficulty for a Deep Neural Network to Learn Concepts of Different Complexities. Neural Information Processing Systems

5.發(fā)現(xiàn)并證明神經(jīng)網(wǎng)絡(luò)表征瓶頸

Huiqi Deng, Qihan Ren, Xu Chen, et al.Discovering and Explaining the Representation Bottleneck of DNNs. International Conference on Learning Representations, 2021, abs/2111.06236

6.神經(jīng)網(wǎng)絡(luò)可解釋性:正本清源,論統(tǒng)一14種輸入重要性歸因算法

Huiqi Deng, Na Zou, Mengnan Du, et al.Understanding and Unifying Fourteen Attribution Methods with Taylor Interactions. arXiv.org, 2023, abs/2303.01506

7.敢問(wèn)深度學(xué)習(xí)路在何方,從統(tǒng)一12種提升對(duì)抗遷移性的算法說(shuō)起

Quanshi Zhang, Xin Wang, Jie Ren, et al.Proving Common Mechanisms Shared by Twelve Methods of Boosting Adversarial Transferability. arXiv.org, 2022, abs/2207.11694

8.論文發(fā)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)(DNN)學(xué)習(xí)交互特征存在兩階段動(dòng)態(tài)過(guò)程,即第一階段抑制中高階交互、學(xué)習(xí)低階交互以提升泛化能力,第二階段逐步學(xué)習(xí)高階交互導(dǎo)致過(guò)擬合,該現(xiàn)象與訓(xùn)練 - 測(cè)試損失差距的變化時(shí)序一致,揭示了 DNN 從欠擬合到過(guò)擬合的起始機(jī)制。

Junpeng Zhang, Qing Li, Liang Lin, et al.Two-Phase Dynamics of Interactions Explains the Starting Point of a DNN Learning Over-Fitted Features. arXiv.org, 2024, abs/2405.10262

9.論文通過(guò)數(shù)學(xué)證明揭示了深度神經(jīng)網(wǎng)絡(luò)(DNN)學(xué)習(xí)交互特征的兩階段動(dòng)態(tài)機(jī)制:初始階段抑制中高階交互以學(xué)習(xí)低階泛化特征,第二階段逐步引入高階交互導(dǎo)致過(guò)擬合,該理論與訓(xùn)練 - 測(cè)試損失差距的變化一致,并通過(guò)多任務(wù)實(shí)驗(yàn)驗(yàn)證了其普適性。

Qihan Ren, Yang Xu, Junpeng Zhang, et al.Towards the Dynamics of a DNN Learning Symbolic Interactions. Neural Information Processing Systems, 2024, abs/2407.19198: 50653–50688

主講人簡(jiǎn)介

張拳石,上海交通大學(xué)電院計(jì)算機(jī)科學(xué)與工程系長(zhǎng)聘副教授,博士生導(dǎo)師,入選國(guó)家級(jí)海外高層次人才引進(jìn)計(jì)劃,獲ACM China新星獎(jiǎng)。他于2014年獲得日本東京大學(xué)博士學(xué)位,于2014-2018年在加州大學(xué)洛杉磯分校(UCLA)從事博士后研究。張拳石在神經(jīng)網(wǎng)絡(luò)可解釋性方向取得了多項(xiàng)具有國(guó)際影響力的創(chuàng)新性成果。張拳石承擔(dān)了TMLR的責(zé)任編輯,CCF-A類(lèi)會(huì)議NeurIPS 2024的領(lǐng)域主席,IJCAI 2020和IJCAI 2021的可解釋性方向的Tutorial,并先后擔(dān)任了AAAI 2019, CVPR 2019, ICML 2021大會(huì)可解釋性方向的分論壇主席。

參與時(shí)間

2025年6月26日(周四)晚上19:30-21:30


報(bào)名加入社群交流

https://pattern.swarma.org/study_group_issue/931?from=wechat

掃碼參與,加入社群,獲取系列讀書(shū)會(huì)永久回看權(quán)限,與社區(qū)的一線(xiàn)科研工作者溝通交流,共同探索大模型可解釋性這一前沿領(lǐng)域的發(fā)展。

大模型可解釋性讀書(shū)會(huì)

集智俱樂(lè)部聯(lián)合上海交通大學(xué)副教授張拳石、阿里云大模型可解釋性團(tuán)隊(duì)負(fù)責(zé)人沈旭、彩云科技首席科學(xué)家肖達(dá)、北京師范大學(xué)碩士生楊明哲和浙江大學(xué)博士生姚云志共同發(fā)起。本讀書(shū)會(huì)旨在突破大模型“黑箱”困境,嘗試從以下四個(gè)視角梳理大語(yǔ)言模型可解釋性的科學(xué)方法論:

自下而上:Transformer circuit 為什么有效?

自上而下:神經(jīng)網(wǎng)絡(luò)的精細(xì)決策邏輯和性能根因是否可以被嚴(yán)謹(jǐn)、清晰地解釋清楚?

復(fù)雜科學(xué):滲流相變、涌現(xiàn)、自組織等復(fù)雜科學(xué)理論如何理解大模型的推理與學(xué)習(xí)能力?

系統(tǒng)工程:如何擁抱不確定性,在具體的業(yè)界實(shí)踐中創(chuàng)造價(jià)值?

五位發(fā)起人老師會(huì)帶領(lǐng)大家研讀領(lǐng)域前沿論文,現(xiàn)誠(chéng)邀對(duì)此話(huà)題感興趣的朋友,一起共創(chuàng)、共建、共享「大模型可解釋性」主題社區(qū),通過(guò)互相的交流與碰撞,促進(jìn)我們更深入的理解以上問(wèn)題。無(wú)論您是致力于突破AI可解釋性理論瓶頸的研究者,探索復(fù)雜系統(tǒng)與智能本質(zhì)的交叉學(xué)科探索者,還是追求模型安全可信的工程實(shí)踐者,誠(chéng)邀您共同參與這場(chǎng)揭開(kāi)大模型“黑箱”的思想盛宴。

讀書(shū)會(huì)計(jì)劃于2025年6月19日啟動(dòng),每周四晚19:30-21:30,預(yù)計(jì)持續(xù)分享10周左右。

詳情請(qǐng)見(jiàn):

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北京軍區(qū)司令空缺,林彪趁機(jī)點(diǎn)將,毛主席反問(wèn):是你四野的人吧?

北京軍區(qū)司令空缺,林彪趁機(jī)點(diǎn)將,毛主席反問(wèn):是你四野的人吧?

南書(shū)房
2025-07-11 15:50:03
共贏!1換2交易方案!太陽(yáng)如愿得到庫(kù)明加,理查茲馳援庫(kù)里沖冠

共贏!1換2交易方案!太陽(yáng)如愿得到庫(kù)明加,理查茲馳援庫(kù)里沖冠

鬼魅突破上籃
2025-07-20 12:19:44
突然崩了!很多人以為手機(jī)壞了!官方緊急回應(yīng)

突然崩了!很多人以為手機(jī)壞了!官方緊急回應(yīng)

浙江之聲
2025-07-21 11:06:07
宗澤后對(duì)親侄女各種背刺,不過(guò)有句話(huà)他還真說(shuō)中了!宗馥莉危險(xiǎn)了

宗澤后對(duì)親侄女各種背刺,不過(guò)有句話(huà)他還真說(shuō)中了!宗馥莉危險(xiǎn)了

美美談情感
2025-07-18 23:41:01
楊瀚森:不在乎別人看法,有時(shí)我看起來(lái)沮喪只因?yàn)槲蚁胨X(jué)

楊瀚森:不在乎別人看法,有時(shí)我看起來(lái)沮喪只因?yàn)槲蚁胨X(jué)

懂球帝
2025-07-21 10:53:50
歐盟向我國(guó)出手后,德財(cái)長(zhǎng):中國(guó)“垃圾產(chǎn)品”,誓言清零中國(guó)制造

歐盟向我國(guó)出手后,德財(cái)長(zhǎng):中國(guó)“垃圾產(chǎn)品”,誓言清零中國(guó)制造

游古史
2025-07-21 11:13:05
衛(wèi)生間男女標(biāo)識(shí)亂象叢生,抽象粗俗、不良暗示,人民日?qǐng)?bào)下場(chǎng)怒批

衛(wèi)生間男女標(biāo)識(shí)亂象叢生,抽象粗俗、不良暗示,人民日?qǐng)?bào)下場(chǎng)怒批

大魚(yú)簡(jiǎn)科
2025-07-20 11:37:40
王偉忠還是沒(méi)忍住,看s媽一直走不出悲傷,終于松口為s家公開(kāi)講話(huà)

王偉忠還是沒(méi)忍住,看s媽一直走不出悲傷,終于松口為s家公開(kāi)講話(huà)

小娛樂(lè)悠悠
2025-07-21 09:39:48
LV近42萬(wàn)香港客戶(hù)資料外泄,香港隱私公署展開(kāi)調(diào)查

LV近42萬(wàn)香港客戶(hù)資料外泄,香港隱私公署展開(kāi)調(diào)查

界面新聞
2025-07-21 08:16:52
驚了!于文文一組“不雅照”流出,竟揭開(kāi)娛樂(lè)圈“不堪”另一面

驚了!于文文一組“不雅照”流出,竟揭開(kāi)娛樂(lè)圈“不堪”另一面

智凌縱橫
2025-07-20 14:24:26
湖南省養(yǎng)老金將迎調(diào)整,歷年定額調(diào)整金額分析,3176元能漲多少?

湖南省養(yǎng)老金將迎調(diào)整,歷年定額調(diào)整金額分析,3176元能漲多少?

興史興談
2025-07-20 17:51:15
湖人裁掉古德溫!連續(xù)放棄兩人為斯馬特騰空間 隊(duì)記列新援優(yōu)缺點(diǎn)

湖人裁掉古德溫!連續(xù)放棄兩人為斯馬特騰空間 隊(duì)記列新援優(yōu)缺點(diǎn)

羅說(shuō)NBA
2025-07-21 10:10:45
45歲母親霧天開(kāi)車(chē)買(mǎi)菜失蹤,10年后女兒打車(chē)上班,發(fā)現(xiàn)是媽媽的愛(ài)車(chē)

45歲母親霧天開(kāi)車(chē)買(mǎi)菜失蹤,10年后女兒打車(chē)上班,發(fā)現(xiàn)是媽媽的愛(ài)車(chē)

今天說(shuō)故事
2025-07-02 17:31:55
終于離隊(duì)了!布倫森:我感覺(jué)每一年步行者都在賣(mài)特納

終于離隊(duì)了!布倫森:我感覺(jué)每一年步行者都在賣(mài)特納

直播吧
2025-07-20 18:56:08
患者心跳未停就被開(kāi)胸取器官,55名醫(yī)生曝行業(yè)潛規(guī)則

患者心跳未停就被開(kāi)胸取器官,55名醫(yī)生曝行業(yè)潛規(guī)則

中產(chǎn)生活指南針
2025-07-21 12:51:22
1962年對(duì)印反擊前夕,各元帥仍在爭(zhēng)論打不打,毛主席一錘定音:打

1962年對(duì)印反擊前夕,各元帥仍在爭(zhēng)論打不打,毛主席一錘定音:打

天夢(mèng)見(jiàn)證
2025-07-14 22:02:22
25歲男子在登山時(shí)凍死,父母直言:不收尸,就讓她留在雪山吧

25歲男子在登山時(shí)凍死,父母直言:不收尸,就讓她留在雪山吧

無(wú)名講堂
2025-07-18 18:44:40
明日開(kāi)播!三部新劇同天定檔,懸疑or復(fù)仇or商戰(zhàn),你打算追哪部?

明日開(kāi)播!三部新劇同天定檔,懸疑or復(fù)仇or商戰(zhàn),你打算追哪部?

影視快通車(chē)
2025-07-21 11:52:56
王鷗又曝猛料!驚人程度不輸夜光劇本,爆料對(duì)象竟是相聲演員

王鷗又曝猛料!驚人程度不輸夜光劇本,爆料對(duì)象竟是相聲演員

策略剖析
2025-07-21 09:46:47
房產(chǎn)證上的人去世了,家人一直住著,不辦過(guò)戶(hù)行不行?

房產(chǎn)證上的人去世了,家人一直住著,不辦過(guò)戶(hù)行不行?

巢客HOME
2025-07-17 10:00:03
2025-07-21 15:15:00
集智俱樂(lè)部 incentive-icons
集智俱樂(lè)部
科普人工智能相關(guān)知識(shí)技能
5234文章數(shù) 4646關(guān)注度
往期回顧 全部

科技要聞

OpenAI自嗨“IMO金牌”遭官方怒斥

頭條要聞

中國(guó)男子在菲律賓被連開(kāi)七槍射殺 兇手還涉另一綁架案

頭條要聞

中國(guó)男子在菲律賓被連開(kāi)七槍射殺 兇手還涉另一綁架案

體育要聞

中國(guó)女籃輸日本,天賦完敗給努力和戰(zhàn)術(shù)

娛樂(lè)要聞

周渝民談大S離開(kāi),F(xiàn)4會(huì)努力再合體

財(cái)經(jīng)要聞

宗馥莉?yàn)楹我獙?duì)"小媽"杜建英虎視眈眈?

汽車(chē)要聞

勞斯萊斯前設(shè)計(jì)師全新力作 榮威M7正式亮相

態(tài)度原創(chuàng)

教育
手機(jī)
房產(chǎn)
旅游
軍事航空

教育要聞

南陽(yáng)市中心城區(qū)2025年普通高中提前批分?jǐn)?shù)線(xiàn)公布!

手機(jī)要聞

余承東自曝:華為Pura 80標(biāo)準(zhǔn)版7月23日開(kāi)啟預(yù)售

房產(chǎn)要聞

海南中學(xué)江東校區(qū)學(xué)區(qū)劃片重磅出爐!這些項(xiàng)目贏麻了!

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

軍事要聞

美記者:若特朗普決定 澤連斯基或被流放

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 兴义市| 凤台县| 舞阳县| 彭州市| 中西区| 栾川县| 高平市| 泰顺县| 安化县| 吴江市| 盱眙县| 临泽县| 厦门市| 淮北市| 上林县| 丘北县| 赫章县| 上思县| 龙山县| 樟树市| 珲春市| 永丰县| 辉南县| 镇沅| 名山县| 西林县| 尚志市| 麟游县| 邢台县| 美姑县| 郓城县| 阳城县| 永登县| 正安县| 阿尔山市| 永嘉县| 新乡市| 灵武市| 石楼县| 西青区| 和顺县|