網易首頁 > 網易號 > 正文申請入駐

大模型背后的深度學習本質是什么？

2025-07-02 08:12:40　來源: CSDN

北京舉報

分享至

AI 浪潮奔涌，中國巨頭紛紛擁抱「模型開源時代」。

6 月 30 日，國內 AI 又迎來了重磅開源日。華為、百度陸續重磅開源旗下的熱門核心大模型。

百度開源了文心大模型 4.5 系列十款模型，包括 47B 和 3B 參數的 MoE 模型，以及 0.3B 的稠密模型，預訓練權重與推理代碼全量開放，文心大模型 4.5 系列開源模型國內下載地址：https://ai.gitcode.com/theme/1939325484087291906

華為宣布開源盤古 70 億參數的稠密模型、盤古 Pro MoE 720 億參數的混合專家模型和基于昇騰的模型推理技術。訪問地址：https://gitcode.com/ascend-tribe。

大模型的開放共享，正推動 AI 技術加速成為新的通用基礎設施，技術發展的重心也必然隨之向更深層的“理解與掌控”遷移——當技術變得觸手可及，如何高效運用、優化乃至創新，則更依賴于對其底層原理的深刻認知。

被譽為機器學習圣經的《模式識別與機器學習》（PRML）作者 Christopher M. Bishop 在其最新著作《深度學習：基礎與概念》（Deep Learning: Foundations and Concepts, DLFC）提到：“大語言模型正在迅速演進，然而其底層 Transformer 架構和注意力機制在過去 5 年基本保持不變，并且機器學習的許多核心原則已被人們熟知數十年。”

Christopher M. Bishop 是微軟劍橋研究院 AI for Science 部門技術院士、英國人工智能委員會創始成員，其經典著作《PRML》被譽為“機器學習圣經”，豆瓣評分高達 9.5。

事實上，今天火熱的 MoE（混合專家）機制可追溯至 1991 年，強化學習理論誕生于 1961 年，而大模型的基礎架構 Transformer 也已是 2017 年的產物。看似快速爆發的 AI 技術，其實是一場跨越數十年的理論積淀與工程融合的結果。

在當前開源模型大規模普及、技術門檻看似降低的背景下，我們更需要回到原點，重新理解那些看似「舊」的深度學習本質。

7 月 1 日晚 20:00，《深度學習：基礎與概念》的三位中文譯者將聯袂做客 CSDN 直播間，結合當下百度文心 4.5 等國產大模型的開源趨勢，共同探討深度學習的未來演進與核心原理。

直播信息

主題：大模型時代的深度學習

時間：7 月 1 日（周二）20:00-21:30

嘉賓：

鄒欣｜中關村學院工程素養發展部負責人
阮思捷｜北京理工大學計算機學院特別副研究員
劉志毅｜中國人工智能領軍科學家，上海市人工智能社會治理協同創新中心研究員
唐小引｜CSDN&《新程序員》執行總編、《萬有引力》主理人（主持）

本次直播，你將聽到什么？

大模型越來越強大，是否會削弱傳統開發技能的價值？
深度學習理論的哪些原理在大模型時代依然經久不衰？
是時候重新理解神經網絡、CNN、Transformer 了嗎？
文心 4.5 等國產模型相繼開源，對開發者意味著什么？
開源 vs 閉源：開發者如何選？風險與機會何在？
現在學 AI，是否還要從概率與矩陣推導學起？
MoE、擴散模型、合成數據等技術，理論基礎何在？

本場直播還特別設置了“開發者提問環節”，歡迎在留言區提前留言，我們將挑選精選問題現場請嘉賓解答。

更有機會贏取直播間精美禮品。

百度開源文心大模型 4.5 系列，不只是一次技術的釋放，更像是理解門檻的重塑。當開源模型成為標配，AI 技術全面滲透每個崗位，我們更迫切需要具備判斷問題的本質及駕馭系統的能力。

7 月 1 日晚 20:00，一場聚焦深度學習與大模型碰撞的對話即將展開。不論你是學生、研究者，還是開發者，歡迎一起回歸“理解的原點”。

立即預約直播間，與你不見不散！

AI 產品爆發，但你的痛點解決了嗎？

2025 全球產品經理大會

8 月 15–16 日

北京·威斯汀酒店

互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人

12 大專題分享，洞察趨勢、拆解路徑、對話未來。

立即掃碼領取大會PPT

搶占 AI 產品下一波紅利

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.