99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

大語言模型2.0——從推斷到自指丨周六直播·大模型2.0讀書會第一期

0
分享至


導語

自從GPT-o1問世以來,大語言模型的發展進入了嶄新的階段——從以預訓練+微調的模式,逐漸向以思維鏈誘導推理,乃至通過結合蒙特卡洛樹搜索以及強化學習相結合的復雜推理模式方向發展。第一期分享于2024年12月7日晚19:30正式開始,北京師范大學系統科學學院教授、集智俱樂部創始人張江老師將帶來「大語言模型2.0——從推斷到自指」的分享。

分享內容簡介

越來越多的研究文獻指出,賦予大語言模型自我校準、自我評估,以及自我反思的能力將能夠大大提高大語言模型在復雜推理任務上的表現。本次分享將站在復雜系統的角度回顧大語言模型的發展歷史,并結合多種規模法則(Scaling Law)系統性地梳理大語言模型的幾個發展階段。最終,通過結合馮諾依曼的復雜度閾值以及自復制自動機理論,指出大模型下一步的演化將朝向自我反思與自我意識的方向而發展。

分享內容大綱

  • 歷史回顧

    • 神經語言模型

    • 詞向量

    • 預訓練語言模型

    • 規模法則(Scaling laws)與涌現能力

  • 從訓練到測試

    • 上下文學習

    • 思維鏈

    • 推理能力邊界

    • 復雜度閾值

  • 搜索與推斷

    • 自我學習

    • 自我評估

    • 思維樹

    • AlphaGo

    • 類AlphaZero樹搜索

    • 新的Scaling Law

  • Self-x AI

    • 自我改進

    • 自我一致性

    • 自我對齊

    • 自我精煉

    • 自我反思

    • 通向自我意識

主講人介紹

張江,北京師范大學系統科學學院教授,集智俱樂部、集智學園創始人,集智科學研究中心理事長,曾任騰訊研究院、華為戰略研究院等特聘顧問。主要研究領域包括因果涌現、復雜系統分析與建模、規模理論等。

主要涉及到的參考文獻

? F.Sun et al.: Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations (slides)

http://www.bigdatalab.ac.cn/~lanyanyan/slides/2015/ACL2015-sun.pdf

? Mikolov, T., Chen, K., Corrado, G., & Dean, J. Efficient Estimation of Word Representations in Vector Space[C]//International Conference on Learning Representations. 2013.

https://arxiv.org/abs/1301.3781

? Qiu, R., Zhou, D., Qian, W., et al. Ask, and it shall be given: Turing completeness of prompting[R]. 2024.

https://arxiv.org/pdf/2411.01992

? Zhou, D., Zhang, S., Gheini, M., et al. Least-to-Most Prompting Enables Complex Reasoning in Large Language Models[J]. ArXiv, abs/2205.10625, 2022: n. pag.

https://arxiv.org/abs/2205.10625

? Pérez, J., Martinez, F., & Barcelo, P. On the Turing Completeness of Modern Neural Network Architectures[J]. ArXiv, abs/1901.03429, 2019: n. pag.

? Siegelmann, H. T., & Sontag, E. D. On the Computational Power of Neural Nets[J]. Journal of Computer and System Sciences, 1995, 50(1): 132–150.

http://binds.cs.umass.edu/papers/1992_Siegelmann_COLT.pdf

https://arxiv.org/abs/1901.03429

? Wei, J., Wang, X., Schuurmans, D., et al. Chain of Thought Prompting Elicits Reasoning in Large Language Models[J]. ArXiv, abs/2201.11903, 2022: n. pag.

https://arxiv.org/abs/2201.11903

? Chen, Q., Wu, X., Wang, Z., et al. Unlocking the Capabilities of Thought: A Reasoning Boundary Framework to Quantify and Optimize Chain-of-Thought[J]. ArXiv, abs/2410.05695, 2024: n. pag.

https://arxiv.org/abs/2410.05695

? Kumar, T., Zhang, Y., & He, C. Scaling Laws for Precision[R]. 2024.

https://arxiv.org/abs/2411.04330

? Wu, Y., Ma, Z., & Li, B. Inference Scaling Laws: An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models[R]. 2024.

https://arxiv.org/abs/2408.00724

? Huang, J., Wang, X., Wei, J., et al. Large Language Models Can Self-Improve[J]. ArXiv, abs/2210.11610, 2022: n. pag.

https://arxiv.org/abs/2210.11610

? Wang, X., Wei, J., Schuurmans, D., et al. Self-Consistency Improves Chain of Thought Reasoning in Language Models[J]. ArXiv, abs/2203.11171, 2022: n. pag.

https://arxiv.org/abs/2203.11171

? Li, X., Wang, X., Gao, J., et al. Self-Alignment with Instruction Backtranslation[J]. ArXiv, abs/2308.06259, 2023: n. pag.

https://arxiv.org/abs/2308.06259

? Madaan, A., Touvron, H., Lample, G., et al. Self-Refine: Iterative Refinement with Self-Feedback[J]. ArXiv, abs/2303.17651, 2023: n. pag.

https://arxiv.org/pdf/2303.17651

? Shinn, N., Labash, A., & Ahn, S. Reflexion: language agents with verbal reinforcement learning[C]//Neural Information Processing Systems. 2023.

https://arxiv.org/pdf/2303.11366

? Tao, Z., Wang, X., & Wei, J. A Survey on Self-Evolution of Large Language Models[J]. ArXiv, abs/2404.14387, 2024: n. pag.

https://arxiv.org/pdf/2404.14387

直播信息

時間:

2024年12月7日(本周六)晚上19:30-21:30

掃碼參與,加入群聊,獲取系列讀書會回看權限,成為人工智能社區的種子用戶,與社區的一線科研工作者與企業實踐者溝通交流,共同推動人工智能社區的發展。

報名成為主講人

讀書會成員均可以在讀書會期間申請成為主講人。主講人作為讀書會成員,均遵循內容共創共享機制,可以獲得報名費退款,并共享本讀書會產生的所有內容資源。詳情請見:

大模型2.0讀書會啟動

o1模型代表大語言模型融合學習與推理的新范式。集智俱樂部聯合北京師范大學系統科學學院教授張江、Google DeepMind研究科學家馮熙棟、阿里巴巴強化學習研究員王維塤和中科院信工所張杰共同發起,本次讀書會將關注大模型推理范式的演進、基于搜索與蒙特卡洛樹的推理優化、基于強化學習的大模型優化、思維鏈方法與內化機制、自我改進與推理驗證。希望通過讀書會探索o1具體實現的技術路徑,幫助我們更好的理解機器推理和人工智能的本質。

從2024年12月7日開始,預計每周六進行一次,持續時間預計 6-8 周左右。歡迎感興趣的朋友報名參加,激發更多的思維火花!

詳情請見:

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美預言家朱迪再爆猛料:美日中命運已定,此島將首遭災

美預言家朱迪再爆猛料:美日中命運已定,此島將首遭災

心靈短笛
2025-05-12 10:05:25
可惜!尼克斯6場加起來只輸11分,其中兩場分差在5分以內

可惜!尼克斯6場加起來只輸11分,其中兩場分差在5分以內

雷速體育
2025-06-01 12:01:28
正大量上市!葉酸是芹菜的20倍,建議中老年常吃強免疫,腿腳帶勁

正大量上市!葉酸是芹菜的20倍,建議中老年常吃強免疫,腿腳帶勁

斯佳麗的小廚房
2025-05-27 07:05:03
阿拉伯五國外長集體譴責以色列

阿拉伯五國外長集體譴責以色列

參考消息
2025-06-01 12:09:17
公職人員下班后聚餐算違紀嗎?中紀委給出明確標準

公職人員下班后聚餐算違紀嗎?中紀委給出明確標準

戶外小阿隋
2025-05-29 10:16:20
86票贊成,美國得州通過新法案,不許中國等外國人在美買房買地

86票贊成,美國得州通過新法案,不許中國等外國人在美買房買地

大道無形我有型
2025-05-30 21:02:48
沒機會躺平了,降息后資金潮必掀滔天浪!

沒機會躺平了,降息后資金潮必掀滔天浪!

棠花咊吟
2025-05-20 20:00:08
生病時親人來探望是啥感受?網友:是人是鬼,從來未曾如此感受過

生病時親人來探望是啥感受?網友:是人是鬼,從來未曾如此感受過

解讀熱點事件
2025-06-01 00:15:08
央視曝光的5種“假水果”騙局,換個名字就坑錢,千萬別上當了

央視曝光的5種“假水果”騙局,換個名字就坑錢,千萬別上當了

市井覓食記
2025-05-16 00:11:23
TVB“御用中風王”新劇再次中風!這次結局最慘!曾演《八仙過海》《天龍八部》角色經典

TVB“御用中風王”新劇再次中風!這次結局最慘!曾演《八仙過海》《天龍八部》角色經典

我愛追港劇
2025-05-31 23:25:15
6月1日起,3 生肖偏財大旺,喜事進門財運匯聚,喜獲豐收

6月1日起,3 生肖偏財大旺,喜事進門財運匯聚,喜獲豐收

人閒情事
2025-06-01 11:12:01
《長安的荔枝》定檔央八,雷佳音岳云鵬主演,要打臉古裝劇沒收視

《長安的荔枝》定檔央八,雷佳音岳云鵬主演,要打臉古裝劇沒收視

農村教育光哥
2025-05-31 12:01:50
歐冠決賽復盤:巴黎“狂鋒”背后有高人指點,請叫他們新典禮中場

歐冠決賽復盤:巴黎“狂鋒”背后有高人指點,請叫他們新典禮中場

直播吧
2025-06-01 11:39:37
關注 | 或在回懟余承東?盧偉冰:詆毀本身就是一種仰望

關注 | 或在回懟余承東?盧偉冰:詆毀本身就是一種仰望

藍色海邊
2025-06-01 11:18:20
斯坦福意外用AI生成超強CUDA內核,性能比人類專家優化得還要好!

斯坦福意外用AI生成超強CUDA內核,性能比人類專家優化得還要好!

量子位
2025-05-31 11:46:56
隱形“嘌呤大戶”被揪出!不想尿酸升高,這4種食物少碰

隱形“嘌呤大戶”被揪出!不想尿酸升高,這4種食物少碰

39健康網
2025-05-28 20:30:39
42歲陳妍希曬慶生照,與兒子溫馨同框,小星星身高猛躥超媽媽肩膀

42歲陳妍希曬慶生照,與兒子溫馨同框,小星星身高猛躥超媽媽肩膀

偵探娛樂
2025-06-01 10:38:20
臉上被男友噴了一記臭屁!妹子得了7年鼻竇炎,鼻子里查出大腸桿菌?

臉上被男友噴了一記臭屁!妹子得了7年鼻竇炎,鼻子里查出大腸桿菌?

英國那些事兒
2025-05-26 23:17:23
華為驚天內部斗爭,余承東直面真相!

華為驚天內部斗爭,余承東直面真相!

一說煙雨任平生
2025-05-31 22:03:45
出差住亞朵,已經成了職場潛規則

出差住亞朵,已經成了職場潛規則

B面人物
2025-05-14 12:38:58
2025-06-01 12:35:00
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5132文章數 4634關注度
往期回顧 全部

科技要聞

特朗普突然炒掉NASA準局長,嫌他不"忠誠"?

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

體育要聞

亞錦賽女子200米:16歲陳妤頡22秒97奪金

娛樂要聞

張若昀夫婦國外遛娃 男方推平價兒童車

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

數碼
家居
教育
親子
公開課

數碼要聞

榮耀Magic V5或六月發,多款新品待發布

家居要聞

原木純白 邂逅自然本真

教育要聞

民生政策 落地有聲|課間15分鐘 讓孩子們動起來的N種可能

親子要聞

媽媽問女兒:想不想讀書?3歲女兒的回答太搞笑了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 明溪县| 平江县| 锦屏县| 曲麻莱县| 平原县| 泽普县| 巴马| 赣榆县| 五指山市| 丰台区| 灵山县| 南华县| 泽州县| 灯塔市| 长泰县| 三门峡市| 合山市| 辉南县| 泸州市| 独山县| 大方县| 夏河县| 株洲市| 西昌市| 遂宁市| 吉首市| 巫溪县| 当阳市| 和林格尔县| 怀远县| 高安市| 昌江| 牙克石市| 三明市| 承德县| 宜兰县| 赫章县| 珲春市| 白山市| 汉源县| 仙游县|