網易首頁 > 網易號 > 正文申請入駐

所有人都在追LLM，高校為何死磕機器學習？

2025-05-13 21:10:03　來源: 機器學習與Python社區

北京舉報

分享至

來源：機器之心

最近，Meta 公司首席 AI 科學家、圖靈獎得主 LeCun 轉發了他在紐約大學的同事 Kyunghyun Cho 的一篇帖子：內容是關于這位教授 2025 學年機器學習研究生課程的教學大綱和講義。

講義地址：https://arxiv.org/abs/2505.03861
教學大綱：https://docs.google.com/document/d/1OngR25IMEM5bJ458J8z4OCnTFG87KJ5ihgWojU1DD64

該課程聚焦于以隨機梯度下降（SGD）為核心的基礎機器學習算法，特意避開大型語言模型（LLM）內容，同時鼓勵學生深入研讀領域經典論文，回溯機器學習的理論發展脈絡。

在這個人人都關注 LLM 的時代，這樣的課程設計乍看似乎很特別。但對比其他高校的課程表會發現，各大高校研究生機器學習課程仍普遍以基礎理論和經典模型為核心。

比如斯坦福 CS229，是經典的機器學習基礎課程，2025 年冬季課程簡介中，課程系統講授包括線性回歸、邏輯回歸、SVM、神經網絡、聚類、降維、EM 算法等基本模型與方法，強調數學推導與優化思想，廣泛應用于跨領域研究。

MIT 的 6.790 課程是其研究生階段的核心機器學習課程，前身為 6.867，現已更新為 6.7900。該課程強調從概率建模和統計推理的角度深入理解機器學習方法，適合希望在理論與實踐之間建立堅實聯系的學生。

清華電子系研究生課程也設置了《機器學習》《統計推斷理論和方法》等核心理論課程。

而最新 LLM 內容多在專門選修課中出現，比如斯坦福大學 CS25: Transformers United，是一門專注于 LLM 和 Transformer 架構的研究型課程，詳見機器之心報道。

可以看出，教育界普遍認為基礎教學有助于學生長遠發展。Cho 在撰寫講義時引用了 Sutton 的「苦澀教訓」，強調通用可擴展方法（如以 SGD 為核心）比具體架構更重要。他刻意省略了復雜體系（如 LLM）而專注于歷史上成熟的算法和數學直覺，認為「一個學期時間不足以深入所有主題」，只能先打下堅實基礎。

此外，Cho 曾在博客中提到，2010–2015 年間深度學習尚未普及時，很多 ML 課程對神經網絡僅作簡單提及。

如今通過強調經典方法、閱讀經典論文，可以讓學生理解知識的源頭與演進脈絡，培養批判性思考能力?？傮w而言，基礎導向的教學能讓學生掌握算法背后的數學原理和優化方法，而不是「盲目套用」最新模型。

理論 VS 實踐

但我們無法逃避的一個問題是：大學培養機制（尤其是研究生 / 博士教育）強調基礎、原理和科研能力，而實際工作環境尤其在工業界常常需要快速響應、工程落地、產品迭代能力。

一味的強調「必須理解深層原理」，在某些語境下，確實可能顯得有些「何不食肉糜」。

「你怎么連 attention 的 Q/K/V 向量都沒推導過就來調模型？」現實可能是：「我只是想學個微調技巧，用 LLaMA 寫個客服機器人。」

對此不少大學也在積極探索解決方案，為彌補科研與工程能力脫節，不少學校推出了「橋接」課程或實踐項目。

例如，斯坦福大學在開設 CS229 等理論課的基礎上，還專門設立了 CS329S《機器學習系統設計》實踐課。這門課著重講授如何構建可實際部署、運行穩定且具備擴展性的機器學習系統，內容包括數據處理、特征提取、模型上線與監控等環節。

CMU 的機器學習博士生必須修讀 10-718《機器學習實踐》課程。在這門課中，學生需要完成學期項目，從頭到尾搭建并部署一個完整的機器學習系統。課程描述明確指出，學生將通過項目學習處理真實場景下的數據問題，掌握從原始數據清洗到模型最終上線的全流程技能。

國內高校也開始重視實踐教學。清華大學電子系與企業合作開設了多門實用性課程，如「大數據技術的應用與實踐」、「高階機器學習」和「智能制造」等，將行業實際案例和編程實踐引入教學過程。

為何高校仍執著于「慢功」？

在當今技術飛速發展的背景下，許多高校依然強調「打好基礎、追求深刻理解」，這并非單純的「固步自封」。

真正的技術能力不僅在于「會用工具」或「能跑模型」，而在于理解方法背后的原理，在面對新問題、新技術時，具備獨立分析、判斷和創造的能力。吳恩達曾在一篇文章中以個人經歷說明持續學習基礎知識的重要性，他強調「牢靠且及時更新的基礎知識是成為一名高產機器學習工程師的關鍵」。

文章鏈接：https://www.deeplearning.ai/the-batch/issue-146/

這種理念的核心在于「抗變化性」。技術潮流更新迅速，從 CNN 到 Transformer，再到 LLM 和多模態系統，每一步都可能顛覆現有工程范式。

要適應這些變化，不能僅靠追逐熱點，而需深入掌握優化、泛化、表示學習等底層理論。只有理解「為何這樣設計」以及「背后的假設是什么」，才能在面對全新技術時避免迷茫。

此外，深厚的基礎是科研與技術創新的起點?？蒲胁粌H是調參或復現論文，更在于提出問題、構建假設、設計新方法。這離不開扎實的數學工具、嚴謹的邏輯訓練以及對經典工作的積累。基礎課程培養的不僅是知識點，更是抽象思維與批判性思考能力。

深度學習教父、圖靈獎得主 Geoffrey Hinton 在接受 MIT Technology Review 采訪時指出，正是對基礎算法的長期堅持和深入研究，才推動了深度學習的突破，「我們花了幾十年時間打磨神經網絡的基本原理，直到 2010 年代才迎來真正的應用爆發?；A知識的積累和理解，是 AI 領域每一次重大進步的根本?！?/strong>

當然，這種教育路徑并非忽視實踐，而是強調：真正的實踐力應建立在理解力之上。不僅要會用工具，更要了解其來龍去脈、適用邊界與改進方向。

因此，「找工作」與「打基礎」并非非此即彼的選擇題，而是時間維度上的權衡。短期內，工具技能能帶來直接的崗位匹配；但長期來看，基礎能力才是跨越技術周期、持續成長的「護城河」。

課程講義

現在我們回過頭來看看這份 100 頁 pdf 的課程講義，它對機器學習進行了全面介紹，涵蓋了基礎概念和現代技術，有興趣的讀者可以閱讀原文。

每一章的結構和內容概要如下：

第一章：能量函數介紹能量函數作為機器學習中的統一主題的概念。解釋了不同的機器學習范式（監督學習、無監督學習、分類、聚類等）如何可以被構架為最小化能量函數。討論潛在變量和正則化在定義和學習能量函數中的作用。

第二章：機器學習中的基本分類思想涵蓋了基本的分類算法，包括感知器、邊際損失、softmax 和交叉熵損失。解釋分類器訓練中的反向傳播，重點在于線性和非線性能量函數。討論了隨機梯度下降（SGD）和自適應學習率優化方法。涉及泛化和模型選擇，包括偏差 - 方差權衡和超參數調整。

第三章：神經網絡的基本構建塊探索了神經網絡架構中常用的構建塊。討論了歸一化技術（批量歸一化、層歸一化）。介紹了卷積塊、循環塊和注意力機制。介紹了神經網絡中置換等變性和不變性的概念。

第四章：概率機器學習和無監督學習說明了如何從概率角度解釋能量函數。涵蓋了變分推斷和高斯混合模型。討論了連續潛在變量模型和變分自編碼器（VAEs）。介紹了重要性采樣及其方差。

第五章：無向生成模型探索無向生成模型，重點介紹受限玻爾茲曼機（RBMs）和專家乘積（PoE）。討論馬爾可夫鏈蒙特卡洛（MCMC）方法用于從 RBMs 中采樣。引入基于能量的生成對抗網絡（EBGANs）。涵蓋自回歸模型。

第六章：進一步話題提供了機器學習中幾個高級主題的概述。討論了一步強化學習和多步強化學習。探索了集成方法（袋裝法，提升法）和貝葉斯機器學習。介紹元學習。探討混合密度網絡和因果關系。

經典論文

最后我們來看看 Cho 提到的經典論文，這里節選了一部分。

「Simple Statistical Gradient-Following Algorithms for Connectionist Reinforcement Learning」——Ronald J. Williams

論文地址：https://link.springer.com/article/10.1007/BF00992696

該論文提出了 REINFORCE 算法，一種基于策略梯度的強化學習方法，用于訓練連接主義模型（如神經網絡）。該算法通過直接優化期望獎勵，奠定了現代策略梯度方法的基礎。

「Efficient Backprop」——Yann LeCun, Leon Bottou, Genevieve B. Orr, Klaus-Robert Müller（重點關注弟 4 節）

論文地址：https://link.springer.com/chapter/10.1007/978-3-642-35289-8_3

系統總結了反向傳播（Backpropagation）的優化技巧，包括學習率調整、權重初始化、激活函數選擇等。第 4 節特別討論了高效訓練神經網絡的實用方法。

「Training Products of Experts by Minimizing Contrastive Divergence」——Geoffrey Hinton

論文地址：https://www.cs.toronto.edu/~hinton/absps/nccd.pdf

提出了對比散度（Contrastive Divergence, CD）算法，用于訓練受限玻爾茲曼機（RBM）和專家乘積模型。這是深度學習復興前的重要工作，為后續深度信念網絡（DBN）奠定了基礎。

「Auto-Encoding Variational Bayes」——D. Kingma, M. Welling

論文地址：https://arxiv.org/abs/1312.6114

提出了變分自編碼器（Variational Autoencoder, VAE），通過變分貝葉斯方法實現高效的生成模型訓練。VAE 結合了神經網絡和概率建模，成為生成模型領域的里程碑。

「Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks」——Chelsea Finn, Pieter Abbeel, Sergey Levine

論文地址：https://arxiv.org/abs/1703.03400

提出了 MAML（Model-Agnostic Meta-Learning），一種通用的元學習算法，使模型能夠通過少量樣本快速適應新任務。MAML 在少樣本學習（Few-Shot Learning）領域具有開創性意義。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網易首頁下載網易新聞客戶端

相關推薦

熱點推薦

2025年中超上海主場VS大連，球場管理員不讓球迷站著看賽

中安在線 2025-06-27 11:59:28
683 跟貼 683

盧宇光在庫爾斯克被無人機擊中，正在搶救

小A看世界 2025-06-27 00:59:10
44836 跟貼 44836

河北網紅公司1.1億元深圳“搶樓”后悔拍，業內認為“成交總價過高”，有何隱情？

每日經濟新聞 2025-06-27 08:19:13
3399 跟貼 3399

熱搜第一！大學生熱得在樓道、操場打地鋪，東北多所高?；貞獰o空調

大風新聞 2025-06-27 14:03:06
254 跟貼 254

上海官宣：后天出梅！下周或現39~40℃酷熱，開啟“鐵板燒”模式

魯中晨報 2025-06-27 15:16:13
84 跟貼 84

苗華被免去中央軍事委員會委員職務

新京報 2025-06-27 15:32:11
0 跟貼 0

手指粗的螺紋鋼一掰就斷？工人發視頻曝光樓盤鋼筋問題，當地通報：情況不實

極目新聞 2025-06-27 00:30:46
2799 跟貼 2799

路中間正安裝漂亮的新護欄男子飆“國粹”：每年都在換

火煉樹 2025-06-27 17:18:52
4322 跟貼 4322

深圳市酒協呼吁酒廠主動減速降價丨封面觀酒

封面新聞 2025-06-27 17:59:05
23 跟貼 23

加沙15歲男孩餓到只剩18公斤醫院營養補劑已枯竭

大象新聞 2025-06-27 12:23:07
5319 跟貼 5319

歐爾班：匈牙利不支持烏克蘭加入歐盟

環球網資訊 2025-06-26 22:09:49
5154 跟貼 5154

伊朗外長：以色列目前擁有90枚核彈頭，除以之外中東其他國家沒有一個擁核；外界估計以色列掌握核武器介于90-200枚之間

揚子晚報 2025-06-27 08:08:24
1 跟貼 1

澎湃回聲丨“逐本”多款產品被曝成分與備案不符：企業致歉并整改

澎湃新聞 2025-06-27 17:12:29
83 跟貼 83

男生高考696分收到清北“橄欖枝”：清華先找到我，北大晚了一步

星視頻 2025-06-27 14:16:59
73 跟貼 73

全程37小時、美軍內部吹噓……美媒揭美軍奔襲伊朗轟炸核設施任務細節

環球網資訊 2025-06-27 06:44:06
1 跟貼 1

突破3萬億港元香港GDP連升9季

南方都市報 2025-06-27 07:04:49
71 跟貼 71

1-5月國有企業利潤總額16514億元同比下降2.8%

界面新聞 2025-06-27 15:54:58
36 跟貼 36

反不正當競爭法完成修訂

新華社 2025-06-27 09:16:16
311 跟貼 311

1棵樹采購價近80萬！福州煙臺山公園“天價樹”調查：已有多棵死亡

揚子晚報 2025-06-27 10:38:28
0 跟貼 0

“成筐的充電寶被攔”！有機場已經提前執行新規定

上觀新聞 2025-06-27 07:34:08
1 跟貼 1

上海一小區電梯頻頻失重急墜，原因“甩鍋”黃梅天？

瀟湘晨報 2025-06-27 21:19:24
0 跟貼 0

最新回應：雙方暫時分開，獨家畫面公布↗

看看新聞Knews 2025-06-27 21:13:17
0 跟貼 0

相機鋰電池無3C標識不能過檢？北京上海機場：相機電池要求不變

新京報 2025-06-27 13:43:41
0 跟貼 0

五臺山和尚扔掉老人供奉大米，在佛殿里滿嘴臟話：這種米我們有的是

小蘿卜絲 2025-06-27 10:52:06
0 跟貼 0

世界頂級數學家張益唐回國全職加盟中山大學

南方都市報 2025-06-27 19:05:13
0 跟貼 0

600415，“大牛股”盤中跌停！發生了什么
新浪財經
2025-06-27 16:49:07

里夫斯拒四年8920萬續約：明夏可追五年2.46億湖媒直言該交易他
顏小白的籃球夢
2025-06-27 00:54:08

2025溫網女單簽表公布！鄭欽文首輪遇苦主，王欣瑜首輪穆霍娃
女網連連看
2025-06-27 20:30:13

“假球”都解釋不了，中國三人男籃闖進世界杯8強，劇情太狗血
真理是我親戚
2025-06-27 15:27:29

二道販子太可惡！小米yu7閑魚訂單鋪天蓋地，雷總管管吧
牛斯克
2025-06-27 09:31:18

張學良兒子張閭琳辭世：9歲赴美，娶陳濟棠侄女，所生兩子皆成才
柳絮憶史
2025-06-17 08:35:03

追求標準答案危害無窮
水寒說語文
2025-06-26 17:30:16

緊急避雷！“毒兒童牙膏”相繼曝光，絕非危言聳聽，家長速自查！
阿傖說事
2025-06-26 08:02:00

你上下行速度多少！工信部：1000Mbps及以上接入速率的固網寬帶接入達2.23億戶
快科技
2025-06-25 16:18:11

這是阿嬌你敢相信嗎？看著也不胖??！而且非常平板該有的都沒看到
素衣讀史
2025-06-21 14:13:38

硅谷殺妻案背后：于軒一從沒有被愛過，對方一直與前女友藕斷絲連
史行途
2025-06-27 18:32:58

貝佐斯夫婦威尼斯婚禮歡迎晚宴賓客們，小李子，卡戴珊家族等人
老吳教育課堂
2025-06-27 15:55:43

中國游戲超越日本！來自日本玩家の認可！IGN日本高度評價《歸唐》！甘肅文旅廳宣布支持開發組古跡掃描
Steam社區
2025-06-26 11:57:21

月薪3萬offer，進去半年就廢了？高薪陷阱，正在毀掉一批年輕人…
火山詩話
2025-06-26 16:49:29

黃一鳴自曝：王思聰每次約她，車費都給10萬，來給5萬，回再給5萬
漢史趣聞
2025-06-24 10:07:59

今年養老金調整有點“小意外”，通知要7月公布嗎？誰能漲的多？
小舟談歷史
2025-06-26 08:44:01

李湘和16歲女兒回國，直奔商場買鞋買衣服，王詩齡不化妝很清純
檸檬有娛樂
2025-06-27 10:13:46

補助標準99元/人，今年全國老年人免費健康體檢項目再擴容
每日經濟新聞
2025-06-26 21:32:42

我媽和二嬸不對付，鄰居蓋房占地二嬸吵不贏，我媽擼起袖子沖上去
多多故事薈
2025-06-10 09:10:03

李月汝首發狂砍15+10，主帥稱贊表現出色
發財西瓜
2025-06-27 12:25:38

2025-06-27 21:40:49

機器學習與Python社區

機器學習算法與Python

3014文章數 11024關注度

往期回顧全部

科技要聞

雷軍：小米汽車成功沒靠營銷，靠的是能力

小米YU7起價剛好便宜1萬劍指特斯拉ModelY

百萬充電寶被緊急召回！民航連夜封殺無3C產品

小米YU7價格來了！標準版起售價25.35萬元

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

6歲女童在西貝就餐被拍照傳播律師:涉嫌侵犯女童隱私

女子網購的"老風祥足金耳飾"發黑長斑店家:別無理取鬧

特朗普或向伊朗投資300億美元但有一項原則不容談判

美伊秘密談判細節披露：投資伊民用核能取消部分制裁

頭條要聞

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

6歲女童在西貝就餐被拍照傳播律師:涉嫌侵犯女童隱私

女子網購的"老風祥足金耳飾"發黑長斑店家:別無理取鬧

特朗普或向伊朗投資300億美元但有一項原則不容談判

美伊秘密談判細節披露：投資伊民用核能取消部分制裁

體育要聞

曼城“庫里”連線，送尤文晚安好夢

國足官方：伊萬下課

維尼修斯傳射82破門皇馬3-0大勝頭名出線將戰尤文

青島GM：楊瀚森登陸NBA是天賦的兌現我們沒辜負他及其父母的信任

世俱杯16強出爐：歐洲9隊+巴甲4強新月成亞洲獨苗

娛樂要聞

炸裂！榜一大姐深夜怒錘頂流

那爾那茜迎來噩夢，雷佳音這次也被拉下水

她長得太美被“金屋藏嬌”,同居27年無名無分

剛剛，易烊千璽電影票房破200億

白玉蘭評委席上的童瑤，讓所有人見識了她的地位

財經要聞

合新鐵路建設材料以次充好多家單位被罰

美元跌跌不休外資押注人民幣匯率補漲

證監會首次對配合造假方同步追責

特朗普稱與中國簽署了貿易協議商務部回應

榮耀正式啟動IPO，新CEO李健的下一個任務：估值

汽車要聞

配置升級/貴賓座椅全新GL8陸上公務艙售22.99萬

多維煥新品價比拉滿沃爾沃全新XC60售價25.49萬起

大家都在重提安全沃爾沃卻選擇沉默

沖擊TOP3，嵐圖這次能成嗎

「省流版」小米YU7上市發布會

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

健康

游戲

教育

公開課

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

北京推薦春日10大賞花勝景地

清明假期，蘇州機關企事業單位停車場免費開放

清明流行“下江南”，揚州民宿訂單同比上漲4倍

呼吸科專家破解呼吸道九大謠言！

別僥幸！這份防溺水指南，請查收

高溫天易傷“心”！這份護心指南請收好

這些“熱量爭議”食物，藏著減脂小心機

“后高考時期”如何進行心理調適？

英雄聯盟新英雄蕓阿娜模型圖溫泉皮有“玉足”

怪獵荒野更新維護想和小伙伴玩的注意錯開時間！

《她的臭腳》上線Steam！動態絲襪褶皺黑科技！

《河洛群俠傳2》主角立繪首曝！天外來客男主超帥

教育要聞

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

高考失利該怎么辦

教育部發布預警：高校招生錄取期間謹防上當受騙

提供1.3萬個崗位！教育部“百縣對百校促就業行動”云南專場啟動

教育部發布預警：高校招生錄取期間謹防上當受騙

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

指紋識別有可能認錯人嗎？

李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

所有人都在追LLM，高校為何死磕機器學習？

雷軍：小米汽車成功沒靠營銷，靠的是能力

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

曼城“庫里”連線，送尤文晚安好夢

炸裂！榜一大姐深夜怒錘頂流

合新鐵路建設材料以次充好 多家單位被罰

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

熱聞|清明假期將至，熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言！

英雄聯盟新英雄蕓阿娜模型圖 溫泉皮有“玉足”

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

所有人都在追LLM，高校為何死磕機器學習？

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

美國打擊伊朗核設施后美軍一將領進入特朗普核心圈

炸裂！榜一大姐深夜怒錘頂流

合新鐵路建設材料以次充好多家單位被罰

配置升級/貴賓座椅全新GL8陸上公務艙售22.99萬

熱聞|清明假期將至，熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言！

英雄聯盟新英雄蕓阿娜模型圖溫泉皮有“玉足”