99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

復雜性科學視角下大語言模型涌現現象的解釋丨周四直播·大模型可解釋性讀書會

0
分享至


導語

集智俱樂部聯合上海交通大學副教授張拳石、阿里云大模型可解釋性團隊負責人沈旭、彩云科技首席科學家肖達、北京師范大學碩士生楊明哲和浙江大學博士生姚云志共同發起。本讀書會旨在突破大模型“黑箱”困境,嘗試從不同視角梳理大語言模型可解釋性的科學方法論。

自菲利普·安德森提出“More is different”之后,涌現現象本身就是一個經久不衰的重要研究問題。那我們能否借助復雜系統涌現理論來解釋甚至預測LLM的涌現現象?這是一個方興未艾的領域,本次讀書會主要為該領域的主要工作做一個概覽性的介紹。

分享簡介

除了人們熟知的神經標度律,大語言模型還展現出了許多神奇的現象,比如涌現、頓悟等等。涌現是指,當LLM的規模達到某一閾值時,模型突然在某些方面的能力有了顯著的提升。這種劇烈的非線性變化看起來是不可預測的。為什么會發生這樣的現象?很多學者已經注意到這樣的現象,并嘗試解釋它。

實際上,在復雜系統研究領域,自菲利普·安德森提出“More is different”之后,涌現現象本身就是一個經久不衰的重要研究問題。那我們能否借助復雜系統涌現理論來解釋甚至預測LLM的涌現現象?這是一個方興未艾的領域,本次讀書會主要為該領域的主要工作做一個概覽性的介紹。

分享大綱

1.現象描述

2.對涌現的初步解釋

3.對涌現的機制解釋

  • 知識量子視角

  • 滲流模型視角

  • 多尺度視角與代理模型

核心概念

涌現

滲流相變

互信息

序參量

神經標度律

參考文獻

1.「大語言模型」通過系統性評估發現,其涌現能力(如復雜推理)在模型規模突破臨界閾值后突然顯現,而非線性增長。(核心發現:當參數規模超過10^22時,LLMs在算術/推理等任務上表現出現躍升式進步,證明能力涌現具有規模依賴性)

Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., Yogatama, D., Bosma, M., Zhou, D., Metzler, D., Chi, E. H., Hashimoto, T., Vinyals, O., Liang, P., Dean, J., & Fedus, W. (2022). Emergent Abilities of Large Language Models (arXiv:2206.07682). arXiv.

2.「大語言模型的涌現能力」通過任務指標重構分析提出質疑,認為其可能是評測中的度量選擇(如非線性評分)或分詞策略帶來的統計假象,而非本質能力躍升。

Schaeffer, R., Miranda, B., & Koyejo, S. (2023). Are Emergent Abilities of Large Language Models a Mirage? (arXiv:2304.15004).

3.「Transformer涌現能力」通過滲流理論建模形式語言任務,揭示其能力突變本質是網絡連接性在訓練中達到臨界閾值后產生的相變現象。

Lubana, E. S., Kawaguchi, K., Dick, R. P., & Tanaka, H. (2024). A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language (arXiv:2408.12578).

4.探討語言模型(LMs)在參數規模和訓練數據擴展時,新能力如何涌現(如復雜推理、多步任務等),并嘗試提供理論解釋。

Arora, S., & Goyal, A. (2023). A Theory for Emergence of Complex Skills in Language Models (arXiv:2307.15936). arXiv. https://doi.org/10.48550/arXiv.2307.15936

5.「神經網絡的量化縮放模型」提出信息壓縮理論,證明模型性能的冪律縮放源于參數空間對數據分布的逐步量化逼近,且最優量化精度隨模型規模對數增長。

Michaud E, Liu Z, Girit U, et al. The quantization model of neural scaling[J]. Advances in Neural Information Processing Systems, 2023, 36: 28699-28722.

6.「語言模型語義涌現量化研究」提出信息熵框架,證明語義理解能力的涌現源于潛在表征空間的層級化重組,其臨界閾值與模型深度呈指數關系。

Chen, H., Yang, X., Zhu, J., & Wang, W. (2024). Quantifying Semantic Emergence in Language Models (arXiv:2405.12617). arXiv.

7.「大語言模型的生物學隱喻研究」提出神經可塑性啟發的訓練框架,證明Transformer注意力機制與生物神經網絡突觸修剪存在動力學相似性,其層級化信息整合遵循能量最小化原則。

Lindsey, et al., "On the Biology of a Large Language Model", Transformer Circuits, 2025.

主講人介紹

楊明哲,北京師范大學系統科學學院碩士生,在張江老師因果涌現研究小組。研究領域是因果涌現、復雜系統自動建模。

參與時間

2025年7月3日(周四)晚上19:30-21:30


報名加入社群交流

https://pattern.swarma.org/study_group_issue/935?from=wechat

掃碼參與,加入社群,獲取系列讀書會永久回看權限,與社區的一線科研工作者溝通交流,共同探索大模型可解釋性這一前沿領域的發展。

大模型可解釋性讀書會

集智俱樂部聯合上海交通大學副教授張拳石、阿里云大模型可解釋性團隊負責人沈旭、彩云科技首席科學家肖達、北京師范大學碩士生楊明哲和浙江大學博士生姚云志共同發起。本讀書會旨在突破大模型“黑箱”困境,嘗試從以下四個視角梳理大語言模型可解釋性的科學方法論:

自下而上:Transformer circuit 為什么有效?

自上而下:神經網絡的精細決策邏輯和性能根因是否可以被嚴謹、清晰地解釋清楚?

復雜科學:滲流相變、涌現、自組織等復雜科學理論如何理解大模型的推理與學習能力?

系統工程:如何擁抱不確定性,在具體的業界實踐中創造價值?

五位發起人老師會帶領大家研讀領域前沿論文,現誠邀對此話題感興趣的朋友,一起共創、共建、共享「大模型可解釋性」主題社區,通過互相的交流與碰撞,促進我們更深入的理解以上問題。無論您是致力于突破AI可解釋性理論瓶頸的研究者,探索復雜系統與智能本質的交叉學科探索者,還是追求模型安全可信的工程實踐者,誠邀您共同參與這場揭開大模型“黑箱”的思想盛宴。

讀書會計劃于2025年6月19日啟動,每周四晚19:30-21:30,預計持續分享10周左右。

詳情請見:

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
北京軍區司令空缺,林彪趁機點將,毛主席反問:是你四野的人吧?

北京軍區司令空缺,林彪趁機點將,毛主席反問:是你四野的人吧?

南書房
2025-07-11 15:50:03
共贏!1換2交易方案!太陽如愿得到庫明加,理查茲馳援庫里沖冠

共贏!1換2交易方案!太陽如愿得到庫明加,理查茲馳援庫里沖冠

鬼魅突破上籃
2025-07-20 12:19:44
突然崩了!很多人以為手機壞了!官方緊急回應

突然崩了!很多人以為手機壞了!官方緊急回應

浙江之聲
2025-07-21 11:06:07
宗澤后對親侄女各種背刺,不過有句話他還真說中了!宗馥莉危險了

宗澤后對親侄女各種背刺,不過有句話他還真說中了!宗馥莉危險了

美美談情感
2025-07-18 23:41:01
楊瀚森:不在乎別人看法,有時我看起來沮喪只因為我想睡覺

楊瀚森:不在乎別人看法,有時我看起來沮喪只因為我想睡覺

懂球帝
2025-07-21 10:53:50
歐盟向我國出手后,德財長:中國“垃圾產品”,誓言清零中國制造

歐盟向我國出手后,德財長:中國“垃圾產品”,誓言清零中國制造

游古史
2025-07-21 11:13:05
衛生間男女標識亂象叢生,抽象粗俗、不良暗示,人民日報下場怒批

衛生間男女標識亂象叢生,抽象粗俗、不良暗示,人民日報下場怒批

大魚簡科
2025-07-20 11:37:40
王偉忠還是沒忍住,看s媽一直走不出悲傷,終于松口為s家公開講話

王偉忠還是沒忍住,看s媽一直走不出悲傷,終于松口為s家公開講話

小娛樂悠悠
2025-07-21 09:39:48
LV近42萬香港客戶資料外泄,香港隱私公署展開調查

LV近42萬香港客戶資料外泄,香港隱私公署展開調查

界面新聞
2025-07-21 08:16:52
驚了!于文文一組“不雅照”流出,竟揭開娛樂圈“不堪”另一面

驚了!于文文一組“不雅照”流出,竟揭開娛樂圈“不堪”另一面

智凌縱橫
2025-07-20 14:24:26
湖南省養老金將迎調整,歷年定額調整金額分析,3176元能漲多少?

湖南省養老金將迎調整,歷年定額調整金額分析,3176元能漲多少?

興史興談
2025-07-20 17:51:15
湖人裁掉古德溫!連續放棄兩人為斯馬特騰空間 隊記列新援優缺點

湖人裁掉古德溫!連續放棄兩人為斯馬特騰空間 隊記列新援優缺點

羅說NBA
2025-07-21 10:10:45
45歲母親霧天開車買菜失蹤,10年后女兒打車上班,發現是媽媽的愛車

45歲母親霧天開車買菜失蹤,10年后女兒打車上班,發現是媽媽的愛車

今天說故事
2025-07-02 17:31:55
終于離隊了!布倫森:我感覺每一年步行者都在賣特納

終于離隊了!布倫森:我感覺每一年步行者都在賣特納

直播吧
2025-07-20 18:56:08
患者心跳未停就被開胸取器官,55名醫生曝行業潛規則

患者心跳未停就被開胸取器官,55名醫生曝行業潛規則

中產生活指南針
2025-07-21 12:51:22
1962年對印反擊前夕,各元帥仍在爭論打不打,毛主席一錘定音:打

1962年對印反擊前夕,各元帥仍在爭論打不打,毛主席一錘定音:打

天夢見證
2025-07-14 22:02:22
25歲男子在登山時凍死,父母直言:不收尸,就讓她留在雪山吧

25歲男子在登山時凍死,父母直言:不收尸,就讓她留在雪山吧

無名講堂
2025-07-18 18:44:40
明日開播!三部新劇同天定檔,懸疑or復仇or商戰,你打算追哪部?

明日開播!三部新劇同天定檔,懸疑or復仇or商戰,你打算追哪部?

影視快通車
2025-07-21 11:52:56
王鷗又曝猛料!驚人程度不輸夜光劇本,爆料對象竟是相聲演員

王鷗又曝猛料!驚人程度不輸夜光劇本,爆料對象竟是相聲演員

策略剖析
2025-07-21 09:46:47
房產證上的人去世了,家人一直住著,不辦過戶行不行?

房產證上的人去世了,家人一直住著,不辦過戶行不行?

巢客HOME
2025-07-17 10:00:03
2025-07-21 15:15:00
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5234文章數 4646關注度
往期回顧 全部

科技要聞

OpenAI自嗨“IMO金牌”遭官方怒斥

頭條要聞

中國男子在菲律賓被連開七槍射殺 兇手還涉另一綁架案

頭條要聞

中國男子在菲律賓被連開七槍射殺 兇手還涉另一綁架案

體育要聞

中國女籃輸日本,天賦完敗給努力和戰術

娛樂要聞

周渝民談大S離開,F4會努力再合體

財經要聞

宗馥莉為何要對"小媽"杜建英虎視眈眈?

汽車要聞

勞斯萊斯前設計師全新力作 榮威M7正式亮相

態度原創

健康
家居
房產
手機
數碼

呼吸科專家破解呼吸道九大謠言!

家居要聞

別樣老上海 重塑復古優雅

房產要聞

海南中學江東校區學區劃片重磅出爐!這些項目贏麻了!

手機要聞

余承東自曝:華為Pura 80標準版7月23日開啟預售

數碼要聞

華為MatePad Pro 12.2英寸新平板定檔 標準/柔光雙版本

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宜阳县| 西平县| 柳州市| 织金县| 通城县| 水城县| 鄱阳县| 江永县| 罗平县| 锡林浩特市| 唐山市| 合江县| 敦化市| 永兴县| 哈密市| 菏泽市| 岚皋县| 天镇县| 鹿邑县| 彭阳县| 专栏| 永川市| 潍坊市| 贵港市| 潼关县| 巴彦县| 五大连池市| 上饶市| 南丰县| 文成县| 兴化市| 松江区| 石柱| 洛南县| 小金县| 乐昌市| 新津县| 吴川市| 恩施市| 江源县| 外汇|