作者:彭鵬 郝洋帆 高策
2024年度諾貝爾物理學獎授予約翰·霍普菲爾德與杰弗里·辛頓,以表彰他們“在利用人工神經網絡進行機器學習方面所做的基礎性發現和發明”。
自1901年首次頒發以來,諾貝爾物理學獎一直被視為科學界的至高榮譽,它見證了物理學一個多世紀以來的每一次劃時代進步。諾貝爾物理學獎授予的當然應該是對基礎物理學、實驗物理學、應用物理學等領域做出杰出貢獻的科學家,但值得特別關注的是,2024年度諾貝爾物理學獎的頒發開創了一個歷史性先例,該殊榮首次授予了在人工智能領域作出卓越貢獻的兩位科學家:美國普林斯頓大學的霍普菲爾德(J. J. Hopfield)與加拿大多倫多大學的辛頓(G. Hinton)。
這一決定迅速在學術界和公眾中引發了廣泛的討論以及質疑,甚至有數位科學家在《自然》(Nature)雜志所刊登的訪談中公開表達了他們的不解:諾貝爾物理學獎,怎么會頒給了在計算機科學領域取得成就的學者[1]?這一看似“打破常規”的頒獎決策,是否預示著科學評價體系正醞釀著一場深刻的變革,抑或是對人工智能技術在當代科學研究中所占據特殊地位的一種明確認可?本文旨在深入剖析這一標志性事件,挖掘其背后蘊含的深遠意義與廣泛影響,并進一步探討人工智能如何與基礎學科相互融合,共同引領科學范式邁向一場全新的革命。
人工智能與諾貝爾獎的碰撞
人類對智能本質的探求,猶如對浩瀚宇宙的無盡探索,是一場永無終點的知識之旅。在此過程中,科學家們不斷超越自我認知的界限,在歷史的長河中留下了深刻的足跡。回望往昔,圖靈(A. Turing)那場著名的演講——“數字計算機能思考嗎?”[2]——不僅激起了哲學領域的廣泛議論,更為人工智能的發展奠定了深邃的思考基礎。圖靈從計算的獨特視角出發,對智能進行了深入的審視,并提出了以機器模擬人類智能這一宏大的設想,從而開啟了人工智能研究的先河。
對人工智能的理論探索可追溯至20世紀中葉,彼時,科學家們深受生物神經系統運作機理的啟迪,著手嘗試構建能模擬人類大腦計算功能的數學模型。1943年,心理學家麥卡洛克(W. S. McCulloch)與數學家皮茨(W. Pitts)攜手提出了人工神經元的開創性數學模型,此成果標志著人工神經網絡研究的正式啟航[3]。羅森布拉特(F. Rosenblatt)在此基礎上更進一步,推出了感知機模型,作為首個人工神經網絡的實例,它已經可以勝任簡單的線性分類任務,但卻無法順利處理包含“異或”這類特殊邏輯的問題[4]。在隨后的數十年間,神經網絡領域的研究遭遇了重大挑戰,其發展因計算能力的局限、算法的不成熟以及理論支撐的匱乏而陷入長期瓶頸,進步遲緩乃至停滯不前。正是在這一背景下,霍普菲爾德與辛頓兩位科學家創新性地將物理學理論融入其中。鑒于物理學思想在處理復雜系統與優化問題方面所展現出的獨特優勢,這一融合最終為神經網絡領域帶來了革命性的突破。
物理學思想推動神經網絡新紀元
霍普菲爾德早期的研究聚焦于凝聚態物理,并在激子和半導體理論方面作出了重要貢獻。他始終堅信自己的研究實踐嚴格遵循著物理學的核心理念與范式,并且從未將物理局限于研究對象的界定之中,而是認為物理學的核心精髓在于世界是可知的。他主張通過分解物體,深入探究其組成部分之間的相互聯系,并依托實驗手段,逐步建立起對物體行為精準而定量的理解框架。霍普菲爾德細化了聯想記憶的概念,即根據部分信息——不管它是否包含誤差,利用相似性尋找正確的目標。1982年,他提出了具備聯想記憶功能的霍普菲爾德網絡模型(Hopfield network),這是一種基于物理學能量函數的遞歸神經網絡[5],其理論框架直接借鑒了物理學中的自旋玻璃理論。該神經網絡呈現出一種簡潔而高效的結構特性,具體表現為一個單層且全連接的網絡架構。在這一架構中,所有神經元均被部署在同一處理層上,并且網絡中的每一個神經元均通過權重與其他所有神經元建立了緊密的連接關系。這種設計構建了一個高度互動且信息流通無障礙的網絡環境,使得所有神經元能夠協同參與信息的處理與存儲任務。神經元的狀態也設計得極為簡潔,它們僅有兩種不同的存在形式。這種設計極大地簡化了網絡的處理邏輯,使得網絡的操作更加直觀易懂。
霍普菲爾德網絡的結構
霍普菲爾德網絡的核心創新在于將物理學中的伊辛模型創造性地引入神經網絡設計中。在伊辛模型中,磁針傾向于與其他磁針對齊或反對齊,推動系統趨向能量最低的穩定狀態[6]?;羝辗茽柕虑擅罱梃b此原理,使神經網絡在能量函數最小化時達到最穩定狀態,從而能“記憶”特定模式或信息。此外,他深刻洞察到由簡單但相互作用的神經元構成的復雜系統能自發展現強大計算能力,這與物理學中的層展論和涌現現象相契合,為神經網絡設計帶來新視角。
在訓練階段,霍普菲爾德網絡憑借其獨特的工作原理,能夠有效地對一系列輸入模式進行“記憶”。該網絡具備存儲多條信息載體的能力,并且其系統能量分布呈現出多個極小值點。當網絡接收到外部信息時,它會依據能量函數動態地調整神經元的狀態,促使網絡重新收斂至記憶庫中與輸入信息最為接近的極小值點,從而恢復出最為相似的存儲信息。這一過程好比在一個崎嶇復雜的地貌上滾動球體,受摩擦力影響,球體將緩慢滾動并最終停駐在附近的低洼處。霍普菲爾德網絡的這一特性不僅使其具備數據恢復的能力,還為其提供了一種有效的糾錯機制:當網絡狀態發生偏差時,通過調整可以使其回歸到能量極低的穩定狀態,從而實現糾錯。然而,霍普菲爾德網絡也存在一定的局限性,即容易陷入局部最優解。由于能量函數存在多個極小值點,網絡在尋找全局最小值的過程中可能會停駐在某個局部最小值處,導致無法恢復到最相似的存儲信息。
盡管如此,霍普菲爾德網絡的研究仍然具有深遠的意義。它不僅成功地模擬了人類大腦中由片段至整體、由抽象至具體的聯想記憶機制,而且為神經網絡的研究開辟了全新的路徑,深刻揭示了神經網絡在解決復雜聯想記憶問題方面所蘊含的巨大潛力。凝聚態物理的主要奠基人安德森(P. W. Anderson)對霍普菲爾德在神經網絡領域的工作給予了高度評價。他指出,盡管對于霍普菲爾德成就的每一個方面,都有神經科學家和計算機科學家聲稱在此之前已有相關研究,但不可否認的是,霍普菲爾德模型對神經網絡后續的發展產生了深遠影響。該模型建立在堅實的數學基礎之上,使得對其功能和準確性的嚴格數學證明成為可能[7]?;羝辗茽柕碌难芯坎粌H為神經網絡模型的設計與構建提供了寶貴的思路與啟示,而且極大地推動了神經網絡在模式識別、優化計算等諸多領域的廣泛應用。
聯想記憶示意圖(?Johan Jarnestad/The Royal Swedish Academy of Sciences)
霍普菲爾德網絡對殘次因子進行檢索的示意圖
基于深厚物理學基礎構建的生成模型
辛頓于1978年獲得了人工智能博士學位。當時神經網絡被視為一個“失敗”的研究方向,甚至被人工智能領域的權威明斯基(M. Minsky)用數學推理證明其“錯誤”。但辛頓卻始終堅守在神經網絡的研究前沿。1985年,辛頓等人提出了玻爾茲曼機模型(Boltzmann machine),該模型在霍普菲爾德網絡的基礎上進一步發展,引入了隨機性和概率分布的概念,很大程度上解決了霍普菲爾德網絡易陷入局部最優解的問題。辛頓曾在一次采訪中明確指出,玻爾茲曼機是霍普菲爾德網絡的延伸與拓展。兩者在理論和方法上具有緊密的傳承關系,共同促進了神經網絡領域的蓬勃發展。
玻爾茲曼機的工作原理深深植根于統計物理學中的玻爾茲曼分布理論,該理論揭示了物理系統中各狀態概率分布與其能量之間的內在聯系:能量越低的狀態越穩定,其出現的可能性也越大。辛頓將這一原理應用于神經網絡的設計之中。在該模型中,神經元被組織為輸入層、隱藏層和輸出層這三大核心組件,各層協同工作,使玻爾茲曼機能夠學習到更為復雜且高度抽象的特征表示,顯著增強了網絡的處理能力和泛化性能[8]。具體而言,模型為每個神經元的狀態以及它們之間的組合都分配了一個特定的“能量值”,這些能量值會隨著訓練過程的推進而發生變化。網絡則致力于尋找那些能量最低、最穩定的狀態。需要注意的是,盡管玻爾茲曼機與霍普菲爾德模型均采納了能量函數的概念,并共同遵循了能量趨近最小化的基本原則,但兩者在能量最小值的處理上卻有著本質的區別。伊辛模型所聚焦的能量最小值,是在給定系統參數下的確定值。相比之下,玻爾茲曼分布中的能量最小值則呈現為一種概率分布的形式,它描繪了在不同能量層級上粒子出現的可能性。這種隨機性使得神經網絡有機會跳出當前的局部最優解,去探索其他可能的更優解。
在模型啟動并投入運行后,它將遵循圖示原理持續工作,直至網絡達成一個穩態或完成預設的迭代輪次。在這個過程中,玻爾茲曼機首先通過正向傳播機制,計算出每個神經元被激活的概率,并據此得出整個網絡的能量水平。然而,由于數據集中可能存在噪聲、異常值,或者數據的分布與模型預期不完全一致。為了解決這個問題,玻爾茲曼機還引入了反向傳播算法——這一算法也是由辛頓等人提出并推廣。在反向傳播階段,模型依據當前狀態與期望狀態之間的偏差,借助梯度下降等優化策略,以縮小這一差異。隨著訓練過程的持續深入,模型將逐漸逼近數據的真實概率分布,其預測結果也將愈發準確。值得一提的是,反向傳播算法的核心思想與物理學中的退火過程具有某種相似性。在退火過程中,系統隨著溫度的逐漸降低,其能量狀態不斷遞減,最終趨于一個穩定且能量最低的狀態[9]。這一過程與反向傳播算法通過不斷調整參數,引導模型逐步穩定,并最終完成任務的過程有著異曲同工之妙。兩者雖源自不同領域,但在追求穩定狀態和優化目標的過程中,展現出了相似的思想。
玻爾茲曼機的訓練流程
與霍普菲爾德不同,辛頓在踏入人工智能研究領域之前,并沒有系統性地深入學習過物理學專業。但他出身于一個物理學底蘊深厚的家庭,其家族中不乏物理學界的佼佼者。辛頓的祖母與流體力學權威泰勒(G. I. Taylor)之母乃嫡親姐妹。此外,辛頓的姑姑寒春(Joan Hinton)是一位杰出的核物理學家,她曾參與曼哈頓計劃,曾與費米(E. Fermi)、泰勒(E. Teller)、張伯倫(O. Chamberlain)以及楊振寧等眾多物理學巨匠共事。她于1948年來到中國,為中國的機械化養殖事業做出了重要貢獻,并成為中國綠卡第一人。而寒春的外祖父布爾(G. Boole)則是布爾代數和布爾邏輯的創始者,他的這一貢獻為現代計算機科學奠定了基礎。
1986年,為了進一步提升模型的訓練效率與實用性,受限玻爾茲曼機(restricted Boltzmann machine)應運而生。它通過限制同一層內神經元之間的連接,提升了模型的訓練速度。這一創新極大地促進了玻爾茲曼機在圖像識別、語音識別等多個領域的廣泛應用,但直到2000年才變得知名。隨著時間的推移,辛頓和他的學生及同事們又開發與優化了一系列深度學習模型和算法,如深度信念網絡的提出以及卷積神經網絡的改進等。其背后蘊含的物理思想,則為神經網絡的研究開辟了全新的視角,極大地增強了神經網絡在解決復雜非線性問題上的能力,更為后續的深度學習技術發展奠定了堅實的理論基石。
玻爾茲曼機與受限玻爾茲曼機的區別
物理學賦能人工智能
如前所述,物理學作為自然科學的基石,在人工智能的發展歷程中發揮了極其重要的作用。如今,人工智能與物理學的融合趨勢日益顯著,物理學不僅為神經網絡的構筑奠定了堅實的理論基礎,更成為推動人工智能技術不斷突破邊界、實現創新的核心驅動力。除了前文提到的玻爾茲曼分布、伊辛模型和退火算法之外,哈密頓神經網絡和混沌神經網絡等實例,亦是物理學思想在神經網絡優化過程中的具體運用?;煦缟窠浘W絡借鑒了混沌理論,通過引入混沌動態特性,提高神經網絡在處理復雜、非線性問題時的學習能力和泛化能力。哈密頓神經網絡則是從哈密頓力學中汲取靈感,通過模擬系統的能量守恒定律來優化神經網絡的性能。哈密頓力學作為經典力學的一個重要分支,利用哈密頓量來精確描述系統狀態與能量之間的內在聯系。哈密頓神經網絡將這一物理原理應用于神經網絡的訓練中,通過從數據中學習描述系統的哈密頓量,進而精準預測系統的動態演變。這種方法使得神經網絡在理解潛在動力學和進行準確預測方面表現出色[10]。這些物理學思想的應用,不僅豐富了神經網絡的研究手段,也推動了神經網絡性能的顯著提升。同時,物理學中的數值模擬技術,如蒙特卡羅模擬、分子動力學模擬等,也被廣泛應用于神經網絡的訓練與優化過程[11]。
此外,量子計算作為量子力學的一項重要應用,也逐漸嶄露頭角,成為驅動神經網絡學習機制、算法設計以及優化策略革新的核心動力。量子力學中的疊加態、糾纏態等核心概念為神經網絡研究注入了全新活力。新興的量子機器學習技術,融合了量子計算的速度與機器學習的強大學習與適應能力。通過模擬微觀粒子所具有的疊加、糾纏、一致性和平行性特性,將傳統的機器學習算法量子化,以增強其表示、推理、學習和數據關聯的能力。例如劍橋量子(?Cambridge Quantum)公司發布了lambeq軟件工具包,該工具包可以將文字轉換為量子電路,為自然語言處理提供了新的計算范式[12]。同時,量子計算領域中的一系列量子算法,如量子近似優化算法與變分量子優化算法,在解決復雜優化問題方面展現出了顯著的優越性與高效性。這些算法能夠充分利用量子比特的獨特性質,同時探索多個潛在的解決方案路徑,從而迅速鎖定全局最優解。鑒于神經網絡中優化問題的普遍存在,量子算法的應用無疑將極大地加速這些優化進程,全面提升神經網絡的性能表現與運行效率。
AI+Science=?
人工智能在發展過程中,持續不斷地從其他基礎科學中汲取靈感與養分?;羝辗茽柕戮W絡、玻爾茲曼機以及新興的量子算法等實例,便是極有力的佐證,彰顯了人工智能背后的科學原理是其持續發展的核心動力和堅實基石。這些原理往往源自多個學科的深度交融,它們共同為人工智能的發展奠定了堅實的理論基礎。在此理念框架下,以物理學為代表的基礎科學不僅為人工智能技術的創新指明了方向,更為其提供了源源不斷的動力和支持,助力AI技術突破現有發展瓶頸,向更為成熟的階段不斷邁進。
五大范式的發展
基礎科學賦能了人工智能的發展,而如今,人工智能也在反過來為基礎科學的持續推進賦能。2024年度諾貝爾化學獎授予了貝克(D. Baker)、哈薩比斯(D. Hassabis)及江珀(J. Jumper)三位科學家,以表彰他們在蛋白質設計和蛋白質結構預測領域作出的貢獻,其中,哈薩比斯與江珀因共同研發名為“AlphaFold”的人工智能模型而獲獎。諾貝爾獎聚焦于人工智能領域,無疑是對人工智能在科學界所獲得廣泛認可與高度重視的有力佐證。近年來,“AI4S”(Artificial Intelligence for Science)這一新興理念正逐漸引領科學研究邁入人工智能驅動的新紀元。在當今信息爆炸的時代洪流中,物理、化學與生物等基礎科學領域正面臨著前所未有的復雜挑戰。正是在這一背景下,人工智能技術憑借其卓越的學習與推理能力,為應對這些嚴峻挑戰開辟了全新的解決路徑。2024年度諾貝爾物理學獎委員會主席穆恩斯(E. Moons)也對此次物理學獎獲獎者們高度評價道:“獲獎者的工作已產生巨大效益,當今物理學諸多領域正廣泛應用人工神經網絡。”因此,在此框架下,人工智能早已不是科學研究的輔助工具,而是成為探索新科學現象與規律的重要驅動力[13]。
基礎科學與人工智能之間形成的強互動關系正逐步成為科學研究的新范式。研究者們開始深入探討一個核心議題:人工智能是否已超越輔助工具的范疇,逐漸發展為一門獨立且成熟的科學學科?如今的人工智能,已遠非“僅僅是一種技術手段或工具”所能概括,在長期的探索與實踐中,它逐漸構建起了一套完備且系統的理論體系,并形成了獨具特色的方法論體系。展望未來,這一全新范式有望展現出更為廣闊而深遠的潛力與價值。它不僅會驅動AI技術的不斷創新與突破性發展,更將促成科學研究方法的根本性變革,加速跨學科融合的進程,為探索宇宙的深邃奧秘,推動人類社會的全面進步開辟出一條嶄新的道路。
霍普菲爾德網絡與玻爾茲曼機的突破性成就,彰顯了作為基礎學科的物理學對其他學科領域的深刻影響?;羝辗茽柕戮W絡憑借其獨特的能量函數和動態特性,為探索大腦的信息處理機制提供了新的視角,而玻爾茲曼機則通過引入概率分布和溫度參數,為模擬大腦學習這一復雜過程構建了一個更為靈活的框架。另一方面,人工智能的持續快速發展,正驅動著科學研究范式的深刻轉變,這為其他基礎學科領域的發展帶來了新的契機。因此,人工智能技術與以物理學為代表的基礎學科之間,正逐漸形成一種雙向促進的新發展范式。諾貝爾物理學獎頒發給在人工智能領域取得卓越成就的兩位研究者,不僅是對人工智能技術的認可,更是肯定了物理學理論和思想在推動人工智能科技進步中所扮演的重要角色。此榮譽之授予,實乃名至實歸。
[本文相關研究受國家自然科學基金青年科學基金項目(11904217)、國家社會科學基金重大項目(16ZDA113)、中國科協創新戰略研究院科研項目“人工智能發展現狀及未來趨勢研究”、國家社會科學基金一般項目(24BZX075)資助。]
作者簡介
彭鵬,副教授;郝洋帆,碩士研究生;高策,教授:山西大學科學技術史研究所,太原 030006。pengpeng@sxu.edu.cn
Peng Peng, Associate Professor; Hao Yangfan, Master Candidate; Gao Ce, Professor: Institute for History of Science and Technology, Shanxi University, Taiyuan 030006.
[1]Castelvecchi D, Callaway E, Kwon D. AI comes to the Nobels: double win sparks debate about scientific fields. Nature, 2024. DOI: 10.1038/d41586-024-03310-8.
[2]Turing A, Braithwaite R, Jefferson G, et al. Can automatic calculating machines be said to think?(1952)//.Copeland B J, ed. The essential turing. Oxford: Clarendon Press, 2004: 487.
[3]McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, 1943, 5: 115-133.
[4]Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain. Psychological Review, 1958, 65(6): 386.
[5]Hopfield J J. Hopfield network. Scholarpedia, 2007, 2(5): 1977.
[6]Cipra B A. An introduction to the Ising model. The American Mathematical Monthly, 1987, 94(10): 937-959.
[7]Hopfield J J. Now what?. 2018. https://pni.princeton.edu/sites/g/files/toruqf321/files/documents/John%20Hopfield%20Now%20What%203_0.pdf.
[8]Hinton G E. Boltzmann machine. Scholarpedia, 2007, 2(5): 1668.
[9]Rutenbar R A. Simulated annealing algorithms: An overview. IEEE Circuits and Devices Magazine, 1989, 5(1): 19-26.
[10]Greydanus S, Dzamba M, Yosinski J. Hamiltonian neural networks. Advances in Neural Information Processing Systems, 2019, 32.
[11]Harrison R L. Introduction to monte carlo simulation//AIP conference proceedings. NIH Public Access, 2010, 1204: 17.
[12]Kartsaklis D, Fan I, Yeung R, et al. lambeq: An efficient high-level python library for quantum NLP. arXiv preprint arXiv:2110.04236, 2021.
[13]楊小康, 許巖巖, 陳露, 等. AI for Science: 智能化科學設施變革基礎研究. 中國科學院院刊, 2024, 39(01): 59-69.
關鍵詞:物理學 人工智能 諾貝爾獎 AI+Science 范式變革■
本文刊載于2025年第77卷第1期《科學》雜志(P47-P51)
《科學》雜志被評定為
2022年度
中國人文社會科學期刊AMI綜合評價(A刊)擴展期刊
本刊已被中國知網、萬方數字化期刊庫、維普網、超星、龍源期刊網等多家數據庫收錄,并在今日頭條上也有不定期轉載,《科學》的今日頭條賬號昵稱也是“科學雜志1915”。實體紙刊在中國郵政報刊訂閱商城官網、雜志鋪官網有售。
《科學》雜志于1915年1月在上海問世,
早年由任鴻雋,楊杏佛,胡明復,趙元任等學者編輯寫作,
是我國歷史最長的綜合性科學刊物。
雜志定位為高級科普期刊,致力于科學知識、理念和科學精神的傳播,科學與人文互動,歷史和前沿并舉,為提升我國全民科學素質和建設創新型國家服務。 雜志現任主編為中國科學院院士白春禮先生,主辦單位為上??茖W技術出版社有限公司。
本文轉載自《科學雜志1915》微信公眾號
《物理》50年精選文章
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.