導(dǎo)語(yǔ)
上海科學(xué)智能研究院、集智科學(xué)研究中心和阿里云聯(lián)合發(fā)布了《AI × Science十大前沿觀察》,梳理出35個(gè)研究前沿,來(lái)推動(dòng)科學(xué)發(fā)展的黃金時(shí)代到來(lái)。本篇為前沿觀察6,掃描下方二維碼,可獲得完整版下載地址、快速鏈接論文原文。
掃描二維碼 下載完整報(bào)告
AI 仿真與系統(tǒng)模擬
背景介紹
在復(fù)雜系統(tǒng)研究中,從微觀的量子粒子,如可控核聚變中的等離子體演化,中觀的物理流體動(dòng)力學(xué)、生物智能運(yùn)動(dòng),到大尺度的全球氣候變化等宏觀現(xiàn)象,都需要通過(guò)科學(xué)仿真工具來(lái)預(yù)測(cè)系統(tǒng)的行為和演化。
從歷史發(fā)展來(lái)看,科學(xué)仿真經(jīng)歷了三個(gè)重要階段:最初基于第一性原理的解析求解,然后主要發(fā)展的數(shù)值模擬方法。然而由于這些真實(shí)系統(tǒng)往往表現(xiàn)出多尺度、多物理場(chǎng)耦合的特征,其復(fù)雜性對(duì)傳統(tǒng)解析和數(shù)值計(jì)算方法提出了巨大挑戰(zhàn),一方面不能保證足夠的精度,一方面又很難從數(shù)據(jù)中發(fā)掘系統(tǒng)的內(nèi)在機(jī)制和因果關(guān)系[2]。
所幸的是,在融合物理約束與數(shù)據(jù)驅(qū)動(dòng)的基礎(chǔ)上,基于AI驅(qū)動(dòng)的新一代科學(xué)仿真技術(shù)應(yīng)運(yùn)而生。AI仿真器和數(shù)字孿生[3]通過(guò)深度學(xué)習(xí)和AI for PDE科學(xué)模擬方法,或引入因果推理框架[4],結(jié)合物理先驗(yàn)知識(shí)構(gòu)建新一代仿真系統(tǒng),為系統(tǒng)行為理解和預(yù)測(cè)開(kāi)辟了新途徑。在生物系統(tǒng)方面,以秀麗線蟲(chóng)為代表的模型生物為研究復(fù)雜生命系統(tǒng)提供了理想平臺(tái),而基于AI驅(qū)動(dòng)的數(shù)字生命體 (AIDO),則構(gòu)建了一個(gè)多尺度系統(tǒng)的基礎(chǔ)模型,實(shí)現(xiàn)了從分子到整體生命的全方位預(yù)測(cè)與模擬。
2024年12月發(fā)布的Genesis項(xiàng)目更是將物理仿真推向了新高度。這個(gè)面向機(jī)器人和人工智能的生成式物理引擎,不僅能高效模擬從剛體到軟體的各類(lèi)物理交互,還首次實(shí)現(xiàn)了通過(guò)自然語(yǔ)言控制的場(chǎng)景生成,為研究具身智能提供了強(qiáng)大工具。
這些進(jìn)展標(biāo)志著科學(xué)仿真正在進(jìn)入一個(gè)新時(shí)代:從單一物理場(chǎng)景擴(kuò)展到多尺度、多學(xué)科交叉,從被動(dòng)觀察轉(zhuǎn)向主動(dòng)探索,從現(xiàn)象預(yù)測(cè)邁向機(jī)理理解。下面我們將詳細(xì)介紹幾項(xiàng)代表性工作。
研究進(jìn)展
進(jìn)展目錄 AI for PDE(人工智能求解偏微分方程) 因果數(shù)字孿生 AI驅(qū)動(dòng)的多尺度數(shù)字有機(jī)體建模 生物-環(huán)境閉環(huán)智能仿真系統(tǒng) 具身生成式物理模擬引擎AI for PDE(人工智能求解偏微分方程)
推薦理由:偏微分方程(PDEs)是現(xiàn)代科學(xué)和工程中不可或缺的數(shù)學(xué)工具,用于精確描述從流體力學(xué)到量子力學(xué)等各種物理現(xiàn)象。但傳統(tǒng)的有限元(FEM)和有限差分方法(FDM)等數(shù)值方法,面臨著計(jì)算成本高昂、難以擴(kuò)展到復(fù)雜幾何形狀和高維問(wèn)題以及處理大規(guī)模數(shù)據(jù)集的局限。由此,結(jié)合人工智能算法的AI for PDE科學(xué)模擬方法應(yīng)運(yùn)而生,通過(guò)將數(shù)據(jù)與PDE信息相結(jié)合,能夠?yàn)樘囟▎?wèn)題提供近似解,并顯著加速傳統(tǒng)的數(shù)值求解算法。
AI for PDE領(lǐng)域涌現(xiàn)出多種創(chuàng)新方法,這些方法利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)來(lái)求解、分析和發(fā)現(xiàn)偏微分方程。以下是對(duì)幾種主要的AI驅(qū)動(dòng)的PDE求解方法的簡(jiǎn)單介紹。
物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)[5]是一種通過(guò)將PDE的控制方程融入神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中,來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)求解PDE的強(qiáng)大框架 。PINNs的核心思想是利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的函數(shù)逼近能力來(lái)表示PDE的解,并通過(guò)最小化一個(gè)包含PDE殘差項(xiàng)和邊界/初始條件項(xiàng)的損失函數(shù)來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù)。近年來(lái),研究人員不斷探索改進(jìn)PINNs在網(wǎng)絡(luò)架構(gòu)(如KAN)、優(yōu)化技術(shù)以及處理復(fù)雜問(wèn)題方面的能力,以解決其在處理高頻和多尺度問(wèn)題時(shí)面臨的挑戰(zhàn) 。Pinn-jax等開(kāi)源庫(kù)的出現(xiàn)進(jìn)一步簡(jiǎn)化了PINNs的開(kāi)發(fā)和訓(xùn)練過(guò)程 。值得一提的是,PINNs不僅可以用于求解已知PDE的正問(wèn)題,還可以應(yīng)用于根據(jù)觀測(cè)數(shù)據(jù)反演PDE參數(shù)或發(fā)現(xiàn)未知物理規(guī)律的反問(wèn)題。
深度能量方法(DEM)[6]是另一種基于物理原理的AI驅(qū)動(dòng)的PDE求解方法,它利用最小勢(shì)能原理來(lái)預(yù)測(cè)靜態(tài)載荷條件下的變形,可以看作是有限元分析的一種替代方案 。與傳統(tǒng)的基于配點(diǎn)的PINNs不同,DEM主要依賴(lài)于一階微分和精確的數(shù)值積分來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。為了彌補(bǔ)傳統(tǒng)DEM缺乏最小余能形式的不足,研究人員提出了深度互補(bǔ)能量方法(DCEM) 。DCEM以應(yīng)力函數(shù)作為輸出,能夠天然地滿足平衡方程。此外,為了提高DEM的精度,研究人員還引入了隨機(jī)傅里葉特征映射等技術(shù),并提出了用于超參數(shù)優(yōu)化的雙循環(huán)架構(gòu) 。DEM的一個(gè)顯著優(yōu)點(diǎn)是其網(wǎng)格無(wú)關(guān)性,這使得它在處理復(fù)雜材料(如超彈性材料和粘彈性材料)的變形問(wèn)題時(shí),無(wú)需生成大量的訓(xùn)練數(shù)據(jù)。
算子學(xué)習(xí)則旨在訓(xùn)練神經(jīng)網(wǎng)絡(luò)直接學(xué)習(xí)PDE解算子,即從輸入函數(shù)空間(如初始條件或邊界條件)到輸出函數(shù)空間(PDE的解)的映射 。DeepONet是一種典型的算子學(xué)習(xí)方法,它基于算子的泛逼近定理,通過(guò)學(xué)習(xí)分支網(wǎng)絡(luò)和干網(wǎng)絡(luò)來(lái)逼近非線性算子。傅里葉神經(jīng)算子(FNOs)則利用傅里葉變換在頻域進(jìn)行卷積操作,能夠高效地學(xué)習(xí)PDE的解算子,并且具有分辨率無(wú)關(guān)性 。物理信息神經(jīng)算子(PINOs)是一種混合方法,它結(jié)合了算子學(xué)習(xí)和物理信息優(yōu)化框架,旨在提高收斂速度和精度 。最近的研究還對(duì)DeepONet[7]進(jìn)行了改進(jìn),允許其Trunk-branch結(jié)構(gòu)中的Branch網(wǎng)對(duì)Trunk網(wǎng)非線性干擾,提出了一種物理信息增強(qiáng)的擴(kuò)展版本,特別適用于解決復(fù)雜的非線性偏微分方程(PDEs),顯著降低了物理?yè)p失。
微分同胚映射算子學(xué)習(xí)(DIMON)[8]是一種新興的AI框架,它能夠比超級(jí)計(jì)算機(jī)更快地在普通個(gè)人電腦上求解復(fù)雜的PDE 。DIMON的關(guān)鍵能力在于,它能夠從單個(gè)已求解的形狀中學(xué)習(xí)模式,并將該解映射到多個(gè)新的形狀上,從而避免了為每個(gè)新形狀重復(fù)進(jìn)行網(wǎng)格劃分和計(jì)算 。這種方法在需要對(duì)多個(gè)復(fù)雜幾何形狀求解PDE的科學(xué)和工程領(lǐng)域具有廣泛的應(yīng)用潛力,包括醫(yī)療保健(如心律失常預(yù)測(cè))、航空航天和材料科學(xué) 。目前DIMON的代碼庫(kù)也已公開(kāi)。
因果數(shù)字孿生
推薦理由:因果數(shù)字孿生 (Causal Digital Twin) [4]將因果推理引入仿真系統(tǒng),不僅能模擬系統(tǒng)行為,還能揭示系統(tǒng)內(nèi)在的因果機(jī)制,為智能決策和干預(yù)提供理論基礎(chǔ)。
傳統(tǒng)的數(shù)字孿生技術(shù)主要關(guān)注系統(tǒng)行為的模擬與預(yù)測(cè),而因果數(shù)字孿生則通過(guò)引入因果推理框架,通過(guò)概率編程與因果推理的深度融合,賦予了系統(tǒng)理解“為什么”的能力。
CausalCity 仿真環(huán)境 | 來(lái)源:McDuff, Daniel, et al. "CausalCity: Complex Simulations with Agency for Causal Discovery and Reasoning." Proceedings of the First Conference on Causal Learning and Reasoning, PMLR 177, 2022, pp. 559-575.
CausalCity[3]就是應(yīng)用果數(shù)字孿生技術(shù)的典型案例,它提供了一個(gè)高保真的仿真環(huán)境,使其能突破簡(jiǎn)單的“模式識(shí)別”,理解因果關(guān)系,這對(duì)自動(dòng)駕駛等復(fù)雜系統(tǒng)非常重要。其核心創(chuàng)新在于引入了“主體性” (Agency) 的概念——環(huán)境中的每個(gè)實(shí)體(如車(chē)輛)都具有基本的智能性,能夠自主決策低層級(jí)行為。這使得研究者可以用簡(jiǎn)單的高層級(jí)配置來(lái)定義復(fù)雜場(chǎng)景,而不需要指定每個(gè)具體的低層級(jí)動(dòng)作。
CausalCity與三個(gè)主流的推理模型進(jìn)行了對(duì)比實(shí)驗(yàn),包括:NRI,使用變分自編碼器框架,通過(guò)節(jié)點(diǎn)間的消息傳遞機(jī)制來(lái)發(fā)現(xiàn)系統(tǒng)中的關(guān)系結(jié)構(gòu)并重建軌跡;NS-DR,基于傳播網(wǎng)絡(luò),將場(chǎng)景中的車(chē)輛建模為圖中的節(jié)點(diǎn),通過(guò)分析節(jié)點(diǎn)間的狀態(tài)傳播來(lái)預(yù)測(cè)車(chē)輛運(yùn)動(dòng);V-CDN,采用一個(gè)三階段架構(gòu),包含感知模塊(提取視覺(jué)特征)、推理模塊(構(gòu)建因果圖譜)及動(dòng)態(tài)模塊(預(yù)測(cè)未來(lái)狀態(tài))。這些方法在簡(jiǎn)單場(chǎng)景下表現(xiàn)良好,但在引入混雜因素(如交通信號(hào)燈)的復(fù)雜場(chǎng)景中性能會(huì)顯著下降,而CausalCity則能表現(xiàn)良好。這揭示了傳統(tǒng)推理方法在處理真實(shí)世界復(fù)雜性時(shí)的局限,以及引入因果推理的重要性。
AI驅(qū)動(dòng)的多尺度數(shù)字有機(jī)體建模
推薦理由: GenBio AI 提出的AI驅(qū)動(dòng)數(shù)字有機(jī)體(AIDO)框架[9],代表了生物計(jì)算仿真領(lǐng)域的一項(xiàng)里程碑式進(jìn)展。該研究首次構(gòu)建了一個(gè)整合分子、細(xì)胞、組織到個(gè)體水平的多尺度基礎(chǔ)模型系統(tǒng),通過(guò)模塊化設(shè)計(jì)和分層整合,實(shí)現(xiàn)了生物學(xué)現(xiàn)象的預(yù)測(cè)、模擬與編程。相較于傳統(tǒng)單任務(wù)模型(如AlphaFold、ESMFold),AIDO在多個(gè)維度實(shí)現(xiàn)了范式突破。
研究團(tuán)隊(duì)開(kāi)發(fā)了覆蓋全生物尺度的基礎(chǔ)模型組件。針對(duì)分子層級(jí),提出了混合分詞器(Hybrid Tokenizer)架構(gòu),通過(guò)幾何深度學(xué)習(xí)編碼蛋白質(zhì)三維結(jié)構(gòu)[10],并結(jié)合序列模型實(shí)現(xiàn)DNA-RNA-蛋白質(zhì)的中央法則統(tǒng)一建模[11];在細(xì)胞層級(jí),設(shè)計(jì)了非對(duì)稱(chēng)編碼器-解碼器框架,有效處理單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的高維稀疏特;在表型層級(jí),則利用自監(jiān)督對(duì)比學(xué)習(xí)構(gòu)建了連續(xù)生理信號(hào)(如血糖、心電圖)的生成式模型[12]。
AIDO 的多層級(jí)架構(gòu):數(shù)據(jù)層、基礎(chǔ)模型系統(tǒng)層、下游實(shí)用層、生物工程應(yīng)用層 | 來(lái)源:"Toward AI-Driven Digital Organism: A System of Multiscale Foundation Models for Predicting, Simulating and Programming Biology at All Levels."
AIDO的創(chuàng)新性體現(xiàn)在其系統(tǒng)性整合能力。通過(guò)可微分計(jì)算圖(DCG)技術(shù),將分子交互網(wǎng)絡(luò)、基因調(diào)控網(wǎng)絡(luò)與細(xì)胞狀態(tài)模型動(dòng)態(tài)連接,形成閉環(huán)反饋機(jī)制。例如,在藥物設(shè)計(jì)場(chǎng)景中,蛋白質(zhì)生成模型可基于結(jié)構(gòu)解碼器生成候選序列,再通過(guò)分子動(dòng)力學(xué)評(píng)分模型反向優(yōu)化生成策略,最終通過(guò)濕實(shí)驗(yàn)驗(yàn)證形成迭代優(yōu)化循環(huán)。
該框架的計(jì)算效率同樣突出。通過(guò)混合架構(gòu)(如CNN-Transformer融合模型)和高效并行化策略,實(shí)現(xiàn)了從基因序列(長(zhǎng)達(dá)百萬(wàn)堿基)到器官級(jí)表型(如UK Biobank隊(duì)列數(shù)據(jù))的多尺度建模。系統(tǒng)支持30+種生物數(shù)據(jù)模態(tài),涵蓋NCBI基因組庫(kù)、PDB結(jié)構(gòu)數(shù)據(jù)庫(kù)等超10億級(jí)數(shù)據(jù)點(diǎn),模型參數(shù)量突破千億級(jí)別。
AIDO的開(kāi)源生態(tài)體系(GitHub: genbio-ai/AIDO)為社區(qū)提供了模塊化擴(kuò)展能力。研究人員可獨(dú)立調(diào)整DNA序列模型(AIDO.DNA[9])、蛋白質(zhì)逆折疊模型(AIDO.ProteinIF[11])等組件,或通過(guò)跨尺度對(duì)齊優(yōu)化實(shí)現(xiàn)全系統(tǒng)升級(jí)。目前,該系統(tǒng)已在300+生物任務(wù)中達(dá)到SOTA性能[11][13]。
隨著生物數(shù)據(jù)量的指數(shù)增長(zhǎng)和計(jì)算架構(gòu)的持續(xù)優(yōu)化,AIDO有望推動(dòng)藥物研發(fā)、合成生物學(xué)、精準(zhǔn)醫(yī)學(xué)等領(lǐng)域的范式變革。未來(lái),通過(guò)整合更多實(shí)驗(yàn)?zāi)B(tài)(如空間轉(zhuǎn)錄組、代謝組)和因果推理機(jī)制[14],該系統(tǒng)或?qū)⒊蔀榻獯a生命復(fù)雜性的核心計(jì)算平臺(tái)。
生物-環(huán)境閉環(huán)智能仿真系統(tǒng)
推薦理由:BAAIWorm天寶項(xiàng)目代表了生物智能仿真研究領(lǐng)域的一項(xiàng)重要進(jìn)展。這項(xiàng)發(fā)表在Nature Computational Science并登上封面的研究[15],首次實(shí)現(xiàn)了將秀麗線蟲(chóng)的神經(jīng)系統(tǒng)、身體和環(huán)境整合到一個(gè)完整的閉環(huán)仿真系統(tǒng)中,為探索“大腦-身體-環(huán)境”交互機(jī)制提供了全新的研究平臺(tái)。
相比于原有的仿真系統(tǒng)(如OpenWorm[16]),BAAIWorm天寶在多個(gè)方面實(shí)現(xiàn)了顯著突破。
研究團(tuán)隊(duì)構(gòu)建了迄今為止最精確的線蟲(chóng)神經(jīng)網(wǎng)絡(luò)模型。該模型包含136個(gè)參與感知和運(yùn)動(dòng)功能的神經(jīng)元[17],每個(gè)神經(jīng)元都采用多艙室模型進(jìn)行建模,精確還原了真實(shí)神經(jīng)元的電生理特性。模型不僅在神經(jīng)元層面實(shí)現(xiàn)了高度仿真,還通過(guò)創(chuàng)新的優(yōu)化算法,使神經(jīng)網(wǎng)絡(luò)整體呈現(xiàn)出與真實(shí)線蟲(chóng)神經(jīng)系統(tǒng)相似的動(dòng)態(tài)特性。
此外,BAAIWorm還是一個(gè)高性能的“身體-環(huán)境”模型,創(chuàng)新性地采用投影動(dòng)力學(xué)作為形變求解器[18],實(shí)現(xiàn)了30幀/秒的實(shí)時(shí)仿真,使環(huán)境尺度提升了兩個(gè)數(shù)量級(jí),既大大提升了計(jì)算效率,又保持了生物力學(xué)特性的準(zhǔn)確性。
更重要的是,研究首次實(shí)現(xiàn)了線蟲(chóng)神經(jīng)網(wǎng)絡(luò)與身體環(huán)境系統(tǒng)的持續(xù)閉環(huán)交互。例如在完整的系統(tǒng)仿真中,環(huán)境中的食物濃度等刺激會(huì)影響線蟲(chóng)感覺(jué)神經(jīng)元,進(jìn)而通過(guò)神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)運(yùn)動(dòng)神經(jīng)元產(chǎn)生協(xié)調(diào)的行為輸出[19],并改變環(huán)境的局部的流體動(dòng)力學(xué)特性反過(guò)來(lái)再影響線蟲(chóng)。這種閉環(huán)設(shè)計(jì)使得系統(tǒng)能夠模擬真實(shí)線蟲(chóng)的行為,如趨化性運(yùn)動(dòng)等復(fù)雜行為模式。系統(tǒng)還開(kāi)發(fā)了創(chuàng)新的行為分析方法,可以穩(wěn)定地量化線蟲(chóng)在三維空間中的運(yùn)動(dòng)軌跡。
線蟲(chóng)天寶概覽 | 來(lái)源:An integrative data-driven model simulating C. elegans brain, body and environment interactions
BAAIWorm天寶展示了如何通過(guò)數(shù)字化重建來(lái)研究復(fù)雜生命系統(tǒng),為理解生物智能本質(zhì)提供了重要指引。目前該系統(tǒng)已開(kāi)源,研究人員可以根據(jù)需要獨(dú)立修改和擴(kuò)展各個(gè)模塊。未來(lái),隨著實(shí)驗(yàn)數(shù)據(jù)的不斷積累和算法的進(jìn)一步優(yōu)化,BAAIWorm天寶有望模擬更多行為模式,涵蓋更多神經(jīng)元和環(huán)境因素,從而在生命科學(xué)和人工智能領(lǐng)域發(fā)揮更大的推動(dòng)作用。
具身生成式物理模擬引擎
推薦理由:Genesis項(xiàng)目[20]由于其高精準(zhǔn)的建模能力,開(kāi)創(chuàng)了一種面向機(jī)器人和人工智能研究的新范式。這個(gè)由卡內(nèi)基梅隆大學(xué)、清華等20多家頂尖機(jī)構(gòu)歷時(shí)24個(gè)月合作開(kāi)發(fā)的生成式物理引擎,不僅展示了AI在物理世界模擬上的突破性進(jìn)展,更為實(shí)現(xiàn)具身智能構(gòu)建了技術(shù)路徑。
Genesis的出現(xiàn)代表了模擬仿真平臺(tái)一個(gè)新的高度:不再局限于單一的物理模擬或機(jī)器人控制,而是構(gòu)建了一個(gè)統(tǒng)一的框架,能夠同時(shí)處理物理規(guī)律、機(jī)器人動(dòng)作、視覺(jué)渲染和人機(jī)交互等多個(gè)維度。這種整體性的方法使得它能夠更真實(shí)地模擬復(fù)雜的物理世界,為機(jī)器人研究、AI應(yīng)用和訓(xùn)練提供更可靠的仿真環(huán)境。
提示: A mobile franka arm heats the corn with the bowl and the microwave | 來(lái)源:Genesis: A Generative and Universal Physics Engine for Robotics and Beyond
Genesis的技術(shù)創(chuàng)新體現(xiàn)在多個(gè)方面。其具有超高效的物理模擬性能,模擬速度比現(xiàn)實(shí)世界快約43萬(wàn)倍,大幅領(lǐng)先現(xiàn)有解決方案;具備精確的物理模型,支持從剛體到軟體,從單一物體到復(fù)雜交互的全方位物理模擬;此外系統(tǒng)采用生成式架構(gòu),通過(guò)自然語(yǔ)言描述就能生成復(fù)雜的物理場(chǎng)景和交互行為。
Genesis在機(jī)器人研究領(lǐng)域展現(xiàn)出獨(dú)特優(yōu)勢(shì),不僅具備覆蓋從人形機(jī)器人到軟體機(jī)器人的全類(lèi)型模擬能力,更在單塊RTX4090顯卡上實(shí)現(xiàn)了26秒完成可遷移至真實(shí)世界的動(dòng)作策略訓(xùn)練,其效率突破將顯著加速機(jī)器人研發(fā)進(jìn)程。
隨著未來(lái)Genesis的開(kāi)源,可能會(huì)持續(xù)在多個(gè)領(lǐng)域引發(fā)連鎖反應(yīng):為計(jì)算機(jī)圖形學(xué)提供更真實(shí)的物理模擬,在機(jī)器人研究中加速算法驗(yàn)證和策略?xún)?yōu)化,在人工智能研究中推進(jìn)具身智能的發(fā)展。Genesis不僅是一個(gè)技術(shù)工具,也代表了一種新的仿真研究范式,將為實(shí)現(xiàn)更智能、更自然的人工智能系統(tǒng)和探索世界的復(fù)雜系統(tǒng)規(guī)律持續(xù)貢獻(xiàn)力量。
挑戰(zhàn)與展望
盡管基于AI的科學(xué)仿真技術(shù)在近年來(lái)取得了顯著進(jìn)展,但仍面臨著一些重要挑戰(zhàn)。
多尺度與多物理場(chǎng)耦合的建模依然是難題。以核聚變等離子體為例,從粒子的量子效應(yīng)到宏觀的流體動(dòng)力學(xué)行為,跨越了數(shù)十個(gè)數(shù)量級(jí)的時(shí)空尺度。現(xiàn)有的仿真方法難以在保持計(jì)算效率的同時(shí)實(shí)現(xiàn)如此大跨度的精確描述。同樣,在全球天氣預(yù)報(bào)中,大氣、海洋、陸地等系統(tǒng)之間復(fù)雜的相互作用也給建模帶來(lái)了巨大挑戰(zhàn)。
仿真系統(tǒng)的可解釋性問(wèn)題依然需要探索。雖然基于深度學(xué)習(xí)的方法顯著提升了預(yù)測(cè)精度,但其內(nèi)部機(jī)制往往難以理解,這限制了科研人員對(duì)系統(tǒng)本質(zhì)規(guī)律的認(rèn)知。盡管有CausalCity等項(xiàng)目嘗試引入因果推理框架,但要在復(fù)雜系統(tǒng)中建立可靠的因果關(guān)系圖譜仍有很長(zhǎng)的路要走。如何在保持高精度預(yù)測(cè)的同時(shí)提升模型的可解釋性,成為了當(dāng)前研究的重要方向。
此外,仿真系統(tǒng)與真實(shí)世界的對(duì)齊同樣具有挑戰(zhàn)性。雖然BAAIWorm等項(xiàng)目展現(xiàn)了在特定領(lǐng)域?qū)崿F(xiàn)高保真仿真的可能,但要將這種成功推廣到更復(fù)雜的生命系統(tǒng)和工程應(yīng)用中仍面臨諸多困難。如何確保仿真結(jié)果能夠準(zhǔn)確反映現(xiàn)實(shí)世界的物理規(guī)律,并與實(shí)驗(yàn)數(shù)據(jù)保持一致,仍需要更深入的研究。
要解決以上問(wèn)題,除了提升計(jì)算能力和革新算法,還需要結(jié)合各種方法創(chuàng)造新的平臺(tái)設(shè)計(jì)方案。一個(gè)可能的發(fā)展方向是將物理規(guī)律、數(shù)據(jù)驅(qū)動(dòng)和因果推理等方法進(jìn)行有機(jī)結(jié)合,發(fā)展新一代混合建模方法。Genesis項(xiàng)目已經(jīng)展示了這種融合的潛力。同時(shí),未來(lái)的仿真系統(tǒng)可能會(huì)更加智能和自主化,通過(guò)主動(dòng)學(xué)習(xí)和迭代優(yōu)化,系統(tǒng)能夠自主設(shè)計(jì)和執(zhí)行虛擬實(shí)驗(yàn),提升模型精度和泛化能力,驗(yàn)證科學(xué)假設(shè),甚至發(fā)現(xiàn)新的物理規(guī)律[19]。隨著這些技術(shù)的不斷成熟,我們有望看到支持多學(xué)科、多尺度的統(tǒng)一仿真框架逐步建立,這將為解決生命科學(xué)、能源、氣候等重大科學(xué)問(wèn)題,研究復(fù)雜系統(tǒng)本質(zhì)規(guī)律開(kāi)辟的新途徑和提供關(guān)鍵支撐。
參考文獻(xiàn)
[1] Cornelio, Cristina, et al. "Combining Data and Theory for Derivable Scientific Discovery with AI-Descartes." Nature Communications, vol. 14, no. 1, 2023, pp. 1777.
https://www.nature.com/articles/s41467-023-37543-4
推薦理由:該論文提出了一個(gè)將數(shù)據(jù)驅(qū)動(dòng)和理論驅(qū)動(dòng)相結(jié)合的科學(xué)發(fā)現(xiàn)框架。
[2] Sch?lkopf, Bernhard, et al. "Toward Causal Representation Learning." Proceedings of the IEEE, vol. 109, 2021, pp. 612-634.
https://ieeexplore.ieee.org/document/9363924
推薦理由:該論文系統(tǒng)性地探討了機(jī)器學(xué)習(xí)中的因果表示問(wèn)題,為因果推理與機(jī)器學(xué)習(xí)的結(jié)合提供了理論基礎(chǔ)。
[3]Lavin, Alexander, et al. "Simulation Intelligence: Towards a New Generation of Scientific Methods." arXiv preprint arXiv:2112.03235, 2021.
https://arxiv.org/abs/2112.03235
推薦理由:該論文提出了新一代科學(xué)仿真方法的愿景,系統(tǒng)性地總結(jié)了AI仿真器和數(shù)字孿生的關(guān)鍵技術(shù)。
[4] McDuff, Daniel, et al. "CausalCity: Complex Simulations with Agency for Causal Discovery and Reasoning." Proceedings of the First Conference on Causal Learning and Reasoning, PMLR 177, 2022, pp. 559-575.
https://proceedings.mlr.press/v177/mcduff22a.html
推薦理由:該工作提出了一個(gè)支持因果發(fā)現(xiàn)與推理的復(fù)雜仿真環(huán)境,為因果學(xué)習(xí)研究提供了重要平臺(tái)。
[5] Yuntian Chen et al. "From PINNs to PIKANs: Recent Advances in Physics-Informed Machine Learning." arXiv preprint, 2024.https://arxiv.org/abs/2410.13228
推薦理由:該論文全面回顧了物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)的最新進(jìn)展,重點(diǎn)關(guān)注網(wǎng)絡(luò)設(shè)計(jì)和特征擴(kuò)展的改進(jìn),展示了物理信息機(jī)器學(xué)習(xí)在科學(xué)計(jì)算中的發(fā)展趨勢(shì)和應(yīng)用價(jià)值。
[6] Sergii Mykhailovskyi, Dmytro Malynovskyi. "Model informed approach to estimate treatment effect in placebo-controlled clinical trials using an artificial intelligence based propensity weighting." Ukrainian Journal of Medicine, Biology and Sport, 2023.https://ouci.dntb.gov.ua/en/works/7qXkGYw9/
推薦理由:該研究提出了一種基于人工智能的傾向性加權(quán)方法來(lái)評(píng)估安慰劑對(duì)照臨床試驗(yàn)中的治療效果,為醫(yī)學(xué)臨床研究提供了更準(zhǔn)確的效果評(píng)估工具。
[7] Niyazi Sergin, Rui Duarte et al. "An architectural analysis of DeepOnet and a general framework." Neurocomputing, 2024.https://www.sciencedirect.com/science/article/pii/S0925231224014462
推薦理由:論文分析了DeepOnet模型的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),特別探討了其主干-分支結(jié)構(gòu)在算子學(xué)習(xí)任務(wù)中的有效性,為深度算子網(wǎng)絡(luò)的設(shè)計(jì)提供了理論基礎(chǔ)和改進(jìn)方向。
[8] Qianxiao Li et al. "DIMON: Learning Solution Operators of Partial Differential Equations on a Diffeomorphic Family of Domains." arXiv preprint, 2024.https://arxiv.org/abs/2402.07250
推薦理由:該研究提出了一個(gè)稱(chēng)為DIMON的通用算子學(xué)習(xí)框架,用于在不同形態(tài)域上學(xué)習(xí)偏微分方程的近似解,為復(fù)雜幾何形狀上的PDE求解提供了創(chuàng)新方法。
[9] Le Song, Eran Segal, Eric Xing. "Toward AI-Driven Digital Organism: A System of Multiscale Foundation Models for Predicting, Simulating and Programming Biology at All Levels." arXiv preprint arXiv:2412.06993v1, 2024.
https://arxiv.org/abs/2412.06993
推薦理由:該論文提出了整合分子至個(gè)體水平的多尺度生物建模框架,通過(guò)模塊化基礎(chǔ)模型系統(tǒng)實(shí)現(xiàn)了跨層級(jí)生物現(xiàn)象的預(yù)測(cè)與編程,為合成生物學(xué)和精準(zhǔn)醫(yī)學(xué)提供了通用計(jì)算范式。
[10] Jiayou Zhang et al. "Balancing locality and reconstruction in protein structure tokenizer." NeurIPS Workshop, 2024.
https://www.biorxiv.org/content/10.1101/2024.12.02.626366v2.abstract
推薦理由:該研究開(kāi)發(fā)了一種基于幾何深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)分詞器,通過(guò)平衡局部特征保留與全局結(jié)構(gòu)重建,顯著提升了三維分子表征在逆折疊和功能預(yù)測(cè)任務(wù)中的性能。
[11] Ning Sun et al. "Mixture of experts enable efficient protein understanding and design." NeurIPS Workshop, 2024.
https://www.biorxiv.org/content/10.1101/2024.11.29.625425v1.abstract
推薦理由:該論文提出專(zhuān)家混合架構(gòu)的蛋白質(zhì)語(yǔ)言模型,通過(guò)動(dòng)態(tài)路由機(jī)制實(shí)現(xiàn)序列-結(jié)構(gòu)聯(lián)合建模,在保證計(jì)算效率的同時(shí)將蛋白質(zhì)生成多樣性提升2.7倍。
[12] Levine, Zachary, et al. "Genetic underpinnings of predicted changes in cardiovascular function using self supervised learning." bioRxiv (2024): 2024-08.
https://www.biorxiv.org/content/10.1101/2024.08.15.608061.abstract
推薦理由:該工作利用自監(jiān)督對(duì)比學(xué)習(xí)解析連續(xù)生理信號(hào)(如心電圖)的動(dòng)態(tài)特征,首次建立了心血管表型與PBMC轉(zhuǎn)錄組數(shù)據(jù)的跨尺度關(guān)聯(lián)網(wǎng)絡(luò)。
[13] Caleb N. Ellington et al. "Accurate DNA representations emerge from genome foundation models." NeurIPS Workshop, 2024.
https://www.biorxiv.org/content/10.1101/2024.12.01.625444.abstract
推薦理由:該研究構(gòu)建了千億參數(shù)規(guī)模的基因組基礎(chǔ)模型,通過(guò)混合注意力機(jī)制有效捕捉長(zhǎng)程序列依賴(lài),在調(diào)控元件預(yù)測(cè)任務(wù)中達(dá)到98.3%的準(zhǔn)確率。
[14] Benjamin Lengerich et al. "Contextualized Machine Learning." arXiv:2310.11340, 2023.
https://arxiv.org/abs/2310.11340
推薦理由:該理論框架系統(tǒng)闡述了上下文感知的機(jī)器學(xué)習(xí)方法,為多模態(tài)生物數(shù)據(jù)建模提供了可解釋的因果推理機(jī)制,顯著提升了模型在復(fù)雜生物系統(tǒng)中的應(yīng)用可靠性。
[15] Zhao, Mengdi, et al. "An integrative data-driven model simulating C. elegans brain, body and environment interactions." Nature Computational Science 4.12 (2024): 978-990.
https://www.nature.com/articles/s43588-024-00738-w
推薦理由:首次構(gòu)建了線蟲(chóng)完整的腦-身體-環(huán)境交互模擬系統(tǒng)。通過(guò)整合神經(jīng)、肌肉和物理數(shù)據(jù),實(shí)現(xiàn)了精確的行為預(yù)測(cè)。為理解生物神經(jīng)系統(tǒng)控制行為提供了新方法。
[16] Sarma, Gopal P., et al. "OpenWorm: overview and recent advances in integrative biological simulation of Caenorhabditis elegans." Philosophical Transactions of the Royal Society B 373.1758 (2018): 20170382.
https://royalsocietypublishing.org/doi/full/10.1098/rstb.2017.0382
推薦理由:介紹了OpenWorm項(xiàng)目的進(jìn)展,這是一個(gè)開(kāi)源的線蟲(chóng)整體仿真平臺(tái)。整合了多層次的生物學(xué)數(shù)據(jù)。為系統(tǒng)生物學(xué)研究提供了重要工具。
[17] Cook, Steven J., et al. "Whole-animal connectomes of both Caenorhabditis elegans sexes." Nature 571.7763 (2019): 63-71.
https://www.nature.com/articles/s41586-019-1352-7
推薦理由:首次完整繪制了雌雄兩種線蟲(chóng)的全身神經(jīng)連接組。揭示了性別特異性的神經(jīng)環(huán)路差異。為理解神經(jīng)系統(tǒng)的性別差異提供了重要參考。
[18] Bouaziz, Sofien, et al. "Projective dynamics: Fusing constraint projections for fast simulation." Seminal Graphics Papers: Pushing the Boundaries, Volume 2. 2023. 787-797.
https://dl.acm.org/doi/abs/10.1145/3596711.3596794
推薦理由:提出了一種新的物理模擬算法投影動(dòng)力學(xué)。通過(guò)融合約束投影實(shí)現(xiàn)快速仿真。在計(jì)算效率和穩(wěn)定性方面取得重要突破。
[19] Wen, Quan, et al. "Proprioceptive coupling within motor neurons drives C. elegans forward locomotion." neuron 76.4 (2012): 750-761.
https://www.cell.com/neuron/fulltext/S0896-6273(12)00805-7
推薦理由:發(fā)現(xiàn)了線蟲(chóng)運(yùn)動(dòng)神經(jīng)元內(nèi)的本體感受耦合機(jī)制。闡明了前向運(yùn)動(dòng)的神經(jīng)控制原理。為理解動(dòng)物運(yùn)動(dòng)控制提供了新見(jiàn)解。
[20] Xian Z, Qiao Y, Xu Z, Wang TH, Chen Z, Zheng J, Xiong Z, Wang Y, Zhang M, Ma P, Wang Y, Dou Z, et al. Genesis: A Generative and Universal Physics Engine for Robotics and Beyond. arXiv preprint. 2024.
https://genesis-embodied-ai.github.io/
推薦理由:Genesis是一個(gè)突破性的生成式物理引擎,由CMU、清華等20多家機(jī)構(gòu)聯(lián)合開(kāi)發(fā)。它實(shí)現(xiàn)了超高效的物理模擬、精確的物理建模和生成式架構(gòu),為機(jī)器人研究和具身智能發(fā)展開(kāi)創(chuàng)新范式。
出品:漆遠(yuǎn)、吳力波、張江 運(yùn)營(yíng):孟晉宇、王婷 撰稿:張江、楊燕青、王婷、王朝會(huì)、十三維、周莉、梁金、袁冰、江千月、劉志毅 鳴謝(按姓氏拼音順序,排名不分先后): 曹風(fēng)雷 、陳小楊 、程遠(yuǎn)、杜沅豈 、段郁、方榯楷 、付彥偉、 高悅、黃柯鑫、李昊、劉圣超、譚偉敏、吳泰霖、吳艷玲、向紅軍、張?bào)K、張艷、朱思語(yǔ)
AI+Science 讀書(shū)會(huì)
詳情請(qǐng)見(jiàn):
1.
2.
3.
4.
5.
6.
7.
8.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.