AI 浪潮奔涌,中國巨頭紛紛擁抱「模型開源時代」。
6 月 30 日,國內 AI 又迎來了重磅開源日。華為、百度陸續重磅開源旗下的熱門核心大模型。
百度開源了文心大模型 4.5 系列十款模型,包括 47B 和 3B 參數的 MoE 模型,以及 0.3B 的稠密模型,預訓練權重與推理代碼全量開放,文心大模型 4.5 系列開源模型國內下載地址:https://ai.gitcode.com/theme/1939325484087291906
華為宣布開源盤古 70 億參數的稠密模型、盤古 Pro MoE 720 億參數的混合專家模型和基于昇騰的模型推理技術。訪問地址:https://gitcode.com/ascend-tribe。
大模型的開放共享,正推動 AI 技術加速成為新的通用基礎設施,技術發展的重心也必然隨之向更深層的“理解與掌控”遷移——當技術變得觸手可及,如何高效運用、優化乃至創新,則更依賴于對其底層原理的深刻認知。
被譽為機器學習圣經的《模式識別與機器學習》(PRML) 作者 Christopher M. Bishop 在其最新著作《深度學習:基礎與概念》(Deep Learning: Foundations and Concepts, DLFC)提到:“大語言模型正在迅速演進,然而其底層 Transformer 架構和注意力機制在過去 5 年基本保持不變,并且機器學習的許多核心原則已被人們熟知數十年。”
Christopher M. Bishop 是微軟劍橋研究院 AI for Science 部門技術院士、英國人工智能委員會創始成員,其經典著作《PRML》被譽為“機器學習圣經”,豆瓣評分高達 9.5。
事實上,今天火熱的 MoE(混合專家)機制可追溯至 1991 年,強化學習理論誕生于 1961 年,而大模型的基礎架構 Transformer 也已是 2017 年的產物。看似快速爆發的 AI 技術,其實是一場跨越數十年的理論積淀與工程融合的結果。
在當前開源模型大規模普及、技術門檻看似降低的背景下,我們更需要回到原點,重新理解那些看似「舊」的深度學習本質。
7 月 1 日晚 20:00,《深度學習:基礎與概念》的三位中文譯者將聯袂做客 CSDN 直播間,結合當下百度文心 4.5 等國產大模型的開源趨勢,共同探討深度學習的未來演進與核心原理。
直播信息
主題:大模型時代的深度學習
時間:7 月 1 日(周二)20:00-21:30
嘉賓:
鄒欣|中關村學院工程素養發展部負責人
阮思捷|北京理工大學計算機學院特別副研究員
劉志毅|中國人工智能領軍科學家,上海市人工智能社會治理協同創新中心研究員
唐小引|CSDN&《新程序員》執行總編、《萬有引力》主理人(主持)
本次直播,你將聽到什么?
大模型越來越強大,是否會削弱傳統開發技能的價值?
深度學習理論的哪些原理在大模型時代依然經久不衰?
是時候重新理解神經網絡、CNN、Transformer 了嗎?
文心 4.5 等國產模型相繼開源,對開發者意味著什么?
開源 vs 閉源:開發者如何選?風險與機會何在?
現在學 AI,是否還要從概率與矩陣推導學起?
MoE、擴散模型、合成數據等技術,理論基礎何在?
本場直播還特別設置了“開發者提問環節”,歡迎在留言區提前留言,我們將挑選精選問題現場請嘉賓解答。
更有機會贏取直播間精美禮品。
百度開源文心大模型 4.5 系列,不只是一次技術的釋放,更像是理解門檻的重塑。當開源模型成為標配,AI 技術全面滲透每個崗位,我們更迫切需要具備判斷問題的本質及駕馭系統的能力。
7 月 1 日晚 20:00,一場聚焦深度學習與大模型碰撞的對話即將展開。不論你是學生、研究者,還是開發者,歡迎一起回歸“理解的原點”。
立即預約直播間,與你不見不散!
AI 產品爆發,但你的痛點解決了嗎?
2025 全球產品經理大會
8 月 15–16 日
北京·威斯汀酒店
互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人
12 大專題分享,洞察趨勢、拆解路徑、對話未來。
立即掃碼領取大會PPT
搶占 AI 產品下一波紅利
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.