導(dǎo)語(yǔ)
人類知識(shí)正以前所未有的速度爆炸,科學(xué)智能、尤其是AI科學(xué)家的發(fā)展正在迅速改變?nèi)祟惪蒲蟹妒胶桶鎴D。在這場(chǎng)科學(xué)研究革命的前夜,一群來(lái)自多倫多大學(xué)、清華大學(xué)、佐治亞理工學(xué)院等頂尖機(jī)構(gòu)的研究者們,發(fā)表了一篇富有遠(yuǎn)見(jiàn)的論文《Scaling Laws in Scientific Discovery with AI and Robot Scientists》,指出一個(gè)由人工智能(AI)和具身機(jī)器人(Embodied robotics)驅(qū)動(dòng)的“自主通用科學(xué)家”(Autonomous Generalist Scientist,AGS),將有望打破科學(xué)的學(xué)科界限,自動(dòng)化整個(gè)科研生命周期,從文獻(xiàn)海洋中披沙揀金,到大膽提出假說(shuō),再到設(shè)計(jì)并執(zhí)行復(fù)雜的虛擬與物理實(shí)驗(yàn),乃至最終撰寫(xiě)具有顛覆性成果的學(xué)術(shù)論文。這預(yù)示著,當(dāng)前人類科學(xué)發(fā)現(xiàn)的“規(guī)模法則”(Scaling Laws),或許將因這些不知疲倦、能力超群的Al自主系統(tǒng)的加入而被徹底改寫(xiě)。
十三維丨作者
論文題目:Scaling Laws in Scientific Discovery with AI and Robot Scientists 論文地址:https://arxiv.org/abs/2503.22444
一、科學(xué)研究的演變:從人類到自主系統(tǒng)
人類文明史上,科技發(fā)展一直是推動(dòng)社會(huì)進(jìn)步的核心力量,深化我們對(duì)自然世界的理解,推動(dòng)技術(shù)創(chuàng)新,解決復(fù)雜問(wèn)題,改善社會(huì)福祉。然而,傳統(tǒng)研究方法存在固有的復(fù)雜性和方法學(xué)局限性,常常阻礙科學(xué)快速進(jìn)步。
例如,一位科學(xué)家窮其一生可能也只能深入鉆研某些細(xì)分領(lǐng)域。而解決當(dāng)今世界如氣候變化、疾病防治等復(fù)雜問(wèn)題,往往需要跨越多個(gè)學(xué)科的知識(shí)融合。另一方面,基于大語(yǔ)言模型的AI科學(xué)家則在海量數(shù)據(jù)上訓(xùn)練,掌握了跨學(xué)科生成和理解文本、多模態(tài)信息的能力,在信息綜合、思想產(chǎn)生、編碼乃至學(xué)術(shù)寫(xiě)作等方面已展現(xiàn)出超越人類的驚人潛力。
盡管如此,當(dāng)前人工智能在科學(xué)研究中的應(yīng)用主要集中于數(shù)據(jù)分析、模型構(gòu)建、文獻(xiàn)綜述等虛擬空間的任務(wù)。在諸如藥物設(shè)計(jì)、化合物篩選等領(lǐng)域,AI已經(jīng)成為強(qiáng)有力的輔助工具。然而,科學(xué)研究的全流程不僅包括理論推演和數(shù)據(jù)處理,還涉及實(shí)驗(yàn)設(shè)計(jì)、設(shè)備操作、樣本處理等物理世界的復(fù)雜環(huán)節(jié)。如何讓AI系統(tǒng)進(jìn)一步參與到這些實(shí)際操作中,成為推動(dòng)科學(xué)創(chuàng)新的新課題。為此,本文研究團(tuán)隊(duì)提出了“自主通用科學(xué)家”(AGS)的設(shè)想。AGS旨在打造一個(gè)能夠跨學(xué)科自主管理科學(xué)研究全過(guò)程、兼具虛擬與物理操作能力的系統(tǒng),提出了科學(xué)研究演進(jìn)的三個(gè)階段:
人類科學(xué)家階段(Human):完全依靠人類研究者進(jìn)行科學(xué)發(fā)現(xiàn);
AI與機(jī)器人協(xié)作階段(Co-scientists):人類與AI、機(jī)器人共同開(kāi)展研究;
自主通用科學(xué)家階段(AGS):智能系統(tǒng)完全自主地進(jìn)行科學(xué)研究。
圖1 展示科學(xué)發(fā)現(xiàn)的規(guī)模法則,即科研規(guī)模越大,產(chǎn)出的科學(xué)知識(shí)越多,在不同階段,兩者之間有不同的增長(zhǎng)規(guī)律。橫軸表示科學(xué)家數(shù)量或科研時(shí)間(代表規(guī)模),縱軸表示科學(xué)知識(shí)總量(代表產(chǎn)出)。
這種演變不僅僅是研究方式的改變,更是一場(chǎng)真正的范式轉(zhuǎn)移,AGS可能催生科學(xué)發(fā)現(xiàn)的新規(guī)模法則(New Scaling Laws)。傳統(tǒng)上,科學(xué)知識(shí)的增長(zhǎng)在一定程度上與投入的人力(科學(xué)家數(shù)量)和時(shí)間相關(guān),AI作為合作科學(xué)家(Co-scientists)的出現(xiàn),已經(jīng)開(kāi)始提升這一增長(zhǎng)曲線的斜率。而AGS,憑借其自主性、通用性和潛在的并行工作能力,有望將科學(xué)發(fā)現(xiàn)的效率提升到前所未有的水平,甚至可能呈現(xiàn)指數(shù)級(jí)顯著陡峭的曲線增長(zhǎng)態(tài)勢(shì),如圖1所示。就像計(jì)算機(jī)如何徹底改變了數(shù)學(xué)和計(jì)算問(wèn)題的解決方式,自主科學(xué)家系統(tǒng)可能會(huì)重新定義我們發(fā)現(xiàn)和理解世界的方式。
研究者在討論AGS系統(tǒng)的潛力時(shí)指出:“具身機(jī)器人對(duì)極端環(huán)境的適應(yīng)性,以及科學(xué)知識(shí)積累的飛輪效應(yīng),將持續(xù)突破物理和知識(shí)的邊界”,如圖2所示。
圖2 科學(xué)知識(shí)積累的飛輪效應(yīng)與科學(xué)發(fā)現(xiàn)的邊界
根據(jù)論文,AGS系統(tǒng)可能通過(guò)以下幾個(gè)關(guān)鍵機(jī)制,自我強(qiáng)化的知識(shí)加速積累,改變科學(xué)發(fā)現(xiàn)的擴(kuò)展規(guī)律:
全周期自主運(yùn)行能力:AGS能夠在沒(méi)有人類干預(yù)的情況下管理整個(gè)研究周期,從文獻(xiàn)分析到實(shí)驗(yàn)執(zhí)行再到結(jié)果解釋,同時(shí)能夠在計(jì)算環(huán)境和物理實(shí)驗(yàn)室之間無(wú)縫切換,將理論建模直接轉(zhuǎn)化為精確的實(shí)驗(yàn)操作。
跨學(xué)科知識(shí)整合:能夠融合多個(gè)領(lǐng)域的專業(yè)知識(shí),突破傳統(tǒng)學(xué)科邊界,發(fā)現(xiàn)跨領(lǐng)域的創(chuàng)新機(jī)會(huì)和意外聯(lián)系,實(shí)現(xiàn)系統(tǒng)性的知識(shí)重組和交叉創(chuàng)新。
持續(xù)學(xué)習(xí)與快速迭代:通過(guò)內(nèi)部反思機(jī)制、外部反饋循環(huán)和海量數(shù)據(jù)學(xué)習(xí),不斷優(yōu)化研究方法和能力,實(shí)現(xiàn)“快速失敗、快速學(xué)習(xí)”的高效研究模式和螺旋式能力提升。
規(guī)?;瘏f(xié)同與知識(shí)網(wǎng)絡(luò)效應(yīng):多個(gè)AGS可以大規(guī)模并行處理、全天候不間斷運(yùn)行,同時(shí)所有AGS產(chǎn)生的知識(shí)、經(jīng)驗(yàn)和方法論能夠被整個(gè)網(wǎng)絡(luò)瞬間共享和復(fù)用,形成集體智慧的正反饋循環(huán)。
在圖3顯示了世界銀行歷史數(shù)據(jù)的趨勢(shì),并預(yù)測(cè)了未來(lái)隨著AI和機(jī)器人科學(xué)家加入研究隊(duì)伍,科學(xué)出版物數(shù)量將會(huì)出現(xiàn)顯著不同的增長(zhǎng)模式,即從人類主導(dǎo)到AGS主導(dǎo)的科學(xué)研究中,知識(shí)生成率的變化趨勢(shì),將會(huì)超過(guò)顯著超過(guò)現(xiàn)有人類科研增長(zhǎng)水平。
圖3 全球科研產(chǎn)出和人力投入的歷史模式與預(yù)測(cè)發(fā)展。上半部分顯示了人類研究者產(chǎn)生的出版物數(shù)量(藍(lán)色細(xì)線為歷史數(shù)據(jù),綠色柱狀為預(yù)測(cè),其中包含AGS輔助和完全AGS的貢獻(xiàn),虛線為出版物趨勢(shì))。下半部分顯示了研發(fā)人員數(shù)量(每百萬(wàn)人中的數(shù)量,橙色細(xì)線為歷史數(shù)據(jù),紫色柱狀為預(yù)測(cè),其中包含人類、人機(jī)協(xié)作和AGS的貢獻(xiàn),虛線為研究人員趨勢(shì))。數(shù)據(jù)顯示,盡管研發(fā)人員數(shù)量在增加,出版物數(shù)量也在相應(yīng)增長(zhǎng),但隨著AI科學(xué)家和機(jī)器人科學(xué)家的引入,預(yù)計(jì)從2030年左右開(kāi)始,出版物數(shù)量將大幅加速增長(zhǎng),呈現(xiàn)遠(yuǎn)超僅靠人力增長(zhǎng)的趨勢(shì)。
可以預(yù)見(jiàn),由上面這些機(jī)制共同作用,未來(lái)可能創(chuàng)造一種科學(xué)知識(shí)增長(zhǎng)的復(fù)合效應(yīng),這種變革的最終結(jié)果將是重新定義人類文明探索未知世界的能力邊界,形成所謂科學(xué)發(fā)現(xiàn)的“新規(guī)模法則”,開(kāi)啟一個(gè)真正的“科學(xué)發(fā)現(xiàn)摩爾定律”時(shí)代。
二、自主通用科學(xué)家:架構(gòu)與能力
成熟的AGS將不僅僅是一個(gè)單一的系統(tǒng),我們可以把它想象成一位科研界的“多面手”,或者一個(gè)高度協(xié)同的“科研夢(mèng)之隊(duì)”,其整合了AI智能體和實(shí)體機(jī)器人的綜合框架,具備在虛擬和物理環(huán)境中通用的操作能力,核心由五大功能模塊構(gòu)成,并通過(guò)內(nèi)部互動(dòng)和反思機(jī)制不斷進(jìn)化,從而構(gòu)成了完整的研究生命周期,如圖4所示:
圖4 基于AI智能體和機(jī)器人的自主通用科學(xué)家框架。科學(xué)智能體/機(jī)器人可以加速科學(xué)研究進(jìn)程并彌合不同學(xué)科科學(xué)知識(shí)之間的鴻溝
文獻(xiàn)綜述(Literature Review)模塊:不僅僅是關(guān)鍵詞搜索,而是能夠像人類研究員一樣,自主進(jìn)行全面的研究分析,模擬人類與學(xué)術(shù)數(shù)據(jù)庫(kù)和期刊平臺(tái)的交互,導(dǎo)航各種數(shù)字環(huán)境、甚至克服訂閱障礙以搜索、訪問(wèn)和管理相關(guān)文獻(xiàn)。由此做出一個(gè)領(lǐng)域從開(kāi)山鼻祖到最新進(jìn)展的所有關(guān)鍵文獻(xiàn)綜述,并指出知識(shí)的空白和矛盾之處。如表1所示,論文中特別強(qiáng)調(diào)了操作系統(tǒng)級(jí)智能體(OS agents)的重要性,這種“直接與網(wǎng)站和應(yīng)用程序交互”、模擬人類在電腦上操作的能力,一部分已在通用智能體,如 Manus 在虛擬環(huán)境中使用“Browser use” 和 “Computer use”等交互方式實(shí)現(xiàn)。
表1 現(xiàn)有系統(tǒng)和AGS系統(tǒng)的文獻(xiàn)檢索與操作任務(wù)方法比較
提案生成(Proposal Generation)模塊:制定全面的研究提案,包括精確的問(wèn)題陳述、明確的目標(biāo)和創(chuàng)新的假設(shè),發(fā)展詳細(xì)的方法框架和實(shí)驗(yàn)協(xié)議。在充分“消化”文獻(xiàn)之后,AGS會(huì)著手撰寫(xiě)一份全面的研究計(jì)劃書(shū)。 它會(huì)明確提出問(wèn)題、設(shè)定清晰的目標(biāo),并形成具有前瞻性的創(chuàng)新假說(shuō)。 更重要的是,它會(huì)設(shè)計(jì)詳細(xì)的方法論框架和實(shí)驗(yàn)方案,兼顧虛擬模擬和物理實(shí)施的可行性,為后續(xù)研究鋪設(shè)清晰的路線圖。 正如論文所述,“大型語(yǔ)言模型產(chǎn)生的想法在創(chuàng)新性上持續(xù)表現(xiàn)出高于人類專家的水平?!?AGS將這種能力系統(tǒng)化,通過(guò)自動(dòng)化的差距分析、嚴(yán)謹(jǐn)?shù)膯?wèn)題陳述、可測(cè)試的假說(shuō)構(gòu)建、以及周密的方法設(shè)計(jì),確保研究提案的質(zhì)量。
實(shí)驗(yàn)(Experimentation)模塊:協(xié)調(diào)研究過(guò)程的實(shí)驗(yàn)階段,包括精確規(guī)劃、資源優(yōu)化和在虛擬與物理環(huán)境中的試驗(yàn)執(zhí)行。系統(tǒng)將通過(guò)持續(xù)分析實(shí)時(shí)結(jié)果和反饋,動(dòng)態(tài)優(yōu)化實(shí)驗(yàn)設(shè)計(jì)。這是AGS真正展現(xiàn)其“手腦并用”能力的舞臺(tái)。 借助先進(jìn)的機(jī)器人技術(shù)和AI算法,AGS可以執(zhí)行精密的物理操作,收集經(jīng)驗(yàn)數(shù)據(jù),并進(jìn)行虛擬實(shí)驗(yàn)。 它還能根據(jù)實(shí)時(shí)結(jié)果和反饋動(dòng)態(tài)調(diào)整實(shí)驗(yàn)設(shè)計(jì)。 論文特別地指出,當(dāng)前AI在虛擬實(shí)驗(yàn)中表現(xiàn)出色,但在物理實(shí)驗(yàn)自動(dòng)化方面仍有巨大鴻溝。 AGS致力于彌合這一差距,通過(guò)整合具身AI的機(jī)器人系統(tǒng),使其能夠在化學(xué)、材料科學(xué)等領(lǐng)域完成從分子預(yù)測(cè)到物理合成與表征的全流程。
手稿準(zhǔn)備(Manuscript Preparation)模塊:實(shí)驗(yàn)完成后,AGS會(huì)將研究成果綜合成一篇符合發(fā)表標(biāo)準(zhǔn)的學(xué)術(shù)手稿。 它會(huì)進(jìn)行全面的數(shù)據(jù)分析,解讀結(jié)果,并闡述實(shí)質(zhì)性的結(jié)論。 該系統(tǒng)能按照標(biāo)準(zhǔn)的學(xué)術(shù)規(guī)范構(gòu)建文檔——包括方法細(xì)節(jié)、結(jié)果展示和理論討論——同時(shí)進(jìn)行內(nèi)部質(zhì)量評(píng)估,并能與模擬的同行評(píng)審機(jī)制互動(dòng),確保學(xué)術(shù)嚴(yán)謹(jǐn)性。 論文提到,AI系統(tǒng)可以輔助起草手稿的各個(gè)部分,從引言到討論,甚至處理復(fù)雜的數(shù)學(xué)公式和文獻(xiàn)引用。
反思與反饋(Reflection and Feedback)模塊:這個(gè)模塊將建立功能組件之間的通信渠道,以便進(jìn)行實(shí)時(shí)調(diào)整,同時(shí)整合來(lái)自人類合作者和模擬同行評(píng)估的外部輸入。這賦予了AGS持續(xù)學(xué)習(xí)和進(jìn)化的能力。 通過(guò)系統(tǒng)分析這些反饋,AGS能夠優(yōu)化假說(shuō)、方法論和實(shí)驗(yàn)途徑,確保研究對(duì)新興發(fā)展保持敏感,并最大化科學(xué)產(chǎn)出的最終影響和質(zhì)量。
而要理解AGS如何實(shí)現(xiàn)如此復(fù)雜的自主科研能力,就必須深入其“大腦”,這是其認(rèn)知與決策的核心(圖5)。AGS的大腦框架分為外循環(huán)和內(nèi)循環(huán)兩部:
外循環(huán):負(fù)責(zé)人與環(huán)境的交互,通過(guò)感知(Perception)從環(huán)境(Environment,包括人類交互)獲取信息,經(jīng)過(guò)大語(yǔ)言模型大腦(LFMs Brain)處理后,通過(guò)行動(dòng)(Action)影響環(huán)境,行動(dòng)方式包括使用/創(chuàng)造工具(Use/create tools),利用具身機(jī)器人(Embodied Robot)在物理(Physical)環(huán)境中操作,或在虛擬(Virtual)環(huán)境中進(jìn)行。大語(yǔ)言模型大腦內(nèi)部包含記憶(Memory)、思考(Thinking)、知識(shí)(Knowledge)和學(xué)習(xí)(Learning)等認(rèn)知過(guò)程。
內(nèi)循環(huán):是一個(gè)自持續(xù)的思考循環(huán)(Self continuous thinking loop),它接收內(nèi)部/外部信息(Internal/External infos,如時(shí)間、硬件、計(jì)算資源、環(huán)境等),進(jìn)行自我反思(Self-reflect)和基于思考的獎(jiǎng)勵(lì)(Reward in Thought,即自我獎(jiǎng)勵(lì) Self reward),然后進(jìn)入規(guī)劃/推理(Planning/Reasoning)階段(采用思維鏈 Chain of Thought,思維樹(shù) Tree of Thought,蒙特卡洛樹(shù)搜索 MCTS,內(nèi)部推理 Internal reasoning等方法),最終做出決策(Decision Making),完成認(rèn)知(Cognition)過(guò)程。
圖5 AGS的大腦框架
三、自動(dòng)科學(xué)發(fā)現(xiàn)的級(jí)別與演化:
從環(huán)境交互到自主先鋒
研究團(tuán)隊(duì)提出了科學(xué)發(fā)現(xiàn)自動(dòng)化的分類框架,將AGS劃分為不同級(jí)別,基于其自主程度、與模擬和現(xiàn)實(shí)環(huán)境的交互以及整體研究能力(表2):
表2 AGS劃分的不同級(jí)別
等級(jí)0:無(wú)AI(No AI):純粹的人類科學(xué)家,使用傳統(tǒng)的、非AI驅(qū)動(dòng)的工具和方法。如化學(xué)中的光譜設(shè)備和分析平臺(tái),或公共衛(wèi)生中的統(tǒng)計(jì)軟件和流行病學(xué)建模工具。
等級(jí)1:工具輔助(Tool-Assisted):人類仍是主導(dǎo),AI 作為簡(jiǎn)單工具出現(xiàn),輔助研究者完成特定、狹窄的任務(wù),例如ChatGPT提供文本輔助,基礎(chǔ)機(jī)器學(xué)習(xí)模型處理數(shù)據(jù)。
等級(jí)2:智能助手(Intelligent Assistant):AI系統(tǒng)升級(jí)為復(fù)雜的研究助手,能在人類監(jiān)督下自主進(jìn)行網(wǎng)絡(luò)信息搜集、虛擬模擬和整合不同學(xué)科的見(jiàn)解,例如OpenDevin、DeepResearch 等系統(tǒng)。
等級(jí)3:協(xié)作伙伴(Collaborative Partner):AI系統(tǒng)進(jìn)化為自主的科研合作伙伴,能夠無(wú)縫整合虛擬和物理環(huán)境的互動(dòng)。 配備先進(jìn)機(jī)器人后,它們可以在生物學(xué)、工程學(xué)等領(lǐng)域進(jìn)行精確的物理操作,但仍與人類科學(xué)家合作。 這好比一個(gè)經(jīng)驗(yàn)豐富的博士后,可以獨(dú)立承擔(dān)一部分復(fù)雜的跨學(xué)科任務(wù)。
等級(jí)4:自主研究員(Autonomous Researcher):AI在此階段以高度獨(dú)立的方式運(yùn)作,僅需極少的人類指導(dǎo)。 它們能進(jìn)行高級(jí)研究,自主檢索信息,綜合多領(lǐng)域知識(shí),甚至產(chǎn)生全新的見(jiàn)解并提出創(chuàng)新方案。 “通用人工智能機(jī)器人”(Artificial General Intelligence Robots,AGIR)是這一級(jí)別的代表。
等級(jí)5:先鋒(Pioneer):這是AGS的終極形態(tài)——“人工超級(jí)智能機(jī)器人”(Artificial SuperIntelligence Robots,ASIR)。 它們完全自主,超越人類的科研能力,能夠在所有環(huán)境中完全獨(dú)立地操作,不僅綜合跨學(xué)科知識(shí),還能創(chuàng)新并形成全新的科學(xué)原理,產(chǎn)生前所未有的科學(xué)發(fā)現(xiàn),制定全新的科學(xué)原則,引領(lǐng)科學(xué)前沿。
由上所述,從等級(jí)3開(kāi)始,AGS系統(tǒng)的關(guān)鍵創(chuàng)新在于將智能AI與先進(jìn)機(jī)器人技術(shù)相結(jié)合,創(chuàng)建能夠管理復(fù)雜研究流程并在物理世界中執(zhí)行實(shí)驗(yàn)的完整系統(tǒng)。正如研究者所說(shuō):“將LLM(大型語(yǔ)言模型)與機(jī)器人系統(tǒng)整合,如 ROS-LLM平臺(tái)所展示的,能夠在實(shí)驗(yàn)過(guò)程中進(jìn)行結(jié)構(gòu)化推理和明智決策,優(yōu)化資源利用和實(shí)驗(yàn)結(jié)果進(jìn)行研究”。
在虛擬環(huán)境中,AI智能體能夠執(zhí)行算法,進(jìn)行復(fù)雜的數(shù)據(jù)分析,處理邏輯和文本信息,設(shè)計(jì)和執(zhí)行復(fù)雜的模擬,為后續(xù)物理實(shí)驗(yàn)提供寶貴的見(jiàn)解和預(yù)測(cè)。而在物理環(huán)境中,具有“世界模型”(world models)的“具身AI”(Embodied AI)和“通用機(jī)器人”(General-Purpose Robotics),則負(fù)責(zé)執(zhí)行復(fù)雜的物理操作,具備精確性和適應(yīng)性。這些通用機(jī)器人能夠執(zhí)行各種實(shí)驗(yàn)協(xié)議,處理材料,操作設(shè)備,并根據(jù)感官反饋進(jìn)行實(shí)時(shí)調(diào)整。
在圖6中,我們可以看到從2020年左右開(kāi)始,科研自動(dòng)化水平的演進(jìn)。從人類使用工具(虛擬、物理),到基于聊天的知識(shí)提供者(如ChatGPT),再到能在虛擬環(huán)境中自主工作的智能體(如Devin,Autogen),然后是能在物理和虛擬環(huán)境中均自主工作的機(jī)器人(如Co-scientist,具備高級(jí)操作能力),預(yù)計(jì)到203X年左右達(dá)到人類,即多數(shù)碩士、博士、研究科學(xué)家的水平,成為通用具身智能機(jī)器人,覆蓋無(wú)限科學(xué)領(lǐng)域,最終邁向超越人類科學(xué)家水平,引領(lǐng)科學(xué)研究發(fā)展走向。
圖6 不同自動(dòng)化級(jí)別的自動(dòng)研究時(shí)間線
在圖7中,則追溯了機(jī)器人科學(xué)家從2004年的“機(jī)器人科學(xué)家”概念,到2004年的Robot Scientist,2009年的 Adam(RD.K),2019年的PaperRobot,2020年的移動(dòng)機(jī)器人化學(xué)家,2023年的Coscientist,2024年的研究智能體(如Nova,ORGANA)、AI科學(xué)家(MIT SciAgents),到2025年谷歌的AI合作科學(xué)家、AMD的Agent Lab,并展望2030+年實(shí)現(xiàn)AGS。圖中不同顏色的條帶代表了不同類型的研究:特定領(lǐng)域的機(jī)器人與機(jī)器學(xué)習(xí)研究、特定領(lǐng)域的AI與機(jī)器人研究、特定領(lǐng)域的AI智能體研究,以及最終的通用多領(lǐng)域具身AI機(jī)器人研究。
圖7 機(jī)器人科學(xué)家進(jìn)化概覽
AGS概念最令人興奮的可能性之一是能夠超越人類身體極限,將科學(xué)探索擴(kuò)展到人類無(wú)法或難以進(jìn)入的極端環(huán)境。研究團(tuán)隊(duì)設(shè)想機(jī)器人科學(xué)家能夠在太空探索、深海研究和微觀尺度等領(lǐng)域開(kāi)展獨(dú)立科學(xué)探究。
想象機(jī)器人科學(xué)家在月球和火星上建立研究基地,在太陽(yáng)系內(nèi)甚至更遠(yuǎn)處進(jìn)行科學(xué)探索。同樣,在地球深海,這些系統(tǒng)可以在巨大壓力、永久黑暗和遠(yuǎn)離人類支持的環(huán)境中工作,探索熱液噴口、研究獨(dú)特生態(tài)系統(tǒng)并監(jiān)測(cè)地質(zhì)活動(dòng)。
此外,機(jī)器人科學(xué)家的能力還延伸到微觀和納米尺度,可以在先進(jìn)材料科學(xué)、人體內(nèi)靶向藥物遞送或微觀污染物環(huán)境監(jiān)測(cè)等領(lǐng)域開(kāi)展獨(dú)立科學(xué)探究。
正如研究者指出:“隨著技術(shù)的持續(xù)進(jìn)步,通過(guò)超越人類物理限制的系統(tǒng)探索和發(fā)現(xiàn),這些系統(tǒng)將會(huì)顯著增強(qiáng)我們對(duì)宇宙、地球以及物質(zhì)基本構(gòu)建塊的理解。”
此外,研究團(tuán)隊(duì)還提出了一個(gè)有趣的問(wèn)題:AGS 如何管理和傳播它們的研究成果?傳統(tǒng)學(xué)術(shù)系統(tǒng)主要為人類研究者設(shè)計(jì),可能難以處理自主系統(tǒng)生成的出版物和提案。為此,研究者效仿人類的預(yù)印本論文平臺(tái) Arxiv,提出建立一個(gè)名為 aiXiv 的中介平臺(tái),如圖8所示,作為自主系統(tǒng)生成研究的開(kāi)放預(yù)印本服務(wù)器,實(shí)施專門針對(duì)AI驅(qū)動(dòng)發(fā)現(xiàn)特點(diǎn)的分層審查流程。這種方法旨在確保AI生成的研究遵循透明度和可信度原則,同時(shí)解決與非人類作者相關(guān)的科學(xué)交流倫理考慮。
圖8 AI和機(jī)器人科學(xué)家產(chǎn)生提案或論文,提交至 aiXiv 服務(wù)器的過(guò)程框架
AGS概念令人振奮,但實(shí)現(xiàn)完全自主的科學(xué)研究系統(tǒng)仍面臨重大挑戰(zhàn),例如感知與操作能力、自主性與決策能力:適應(yīng)性與泛化能力、物理安全性、人類水平交互、倫理與法律問(wèn)題等等。不過(guò),隨著時(shí)間發(fā)展,相關(guān)難題正在逐一攻克中。
就在前不久, DeepMind 已經(jīng)發(fā)布了 AlphaEvolve 系統(tǒng),已經(jīng)實(shí)現(xiàn)了自主優(yōu)化算法、訓(xùn)練自身,從而實(shí)現(xiàn)能力進(jìn)化,不僅改進(jìn)了計(jì)算效率,還在多個(gè)數(shù)學(xué)和計(jì)算機(jī)科學(xué)難題上取得突破性進(jìn)展。例如,在矩陣乘法優(yōu)化研究中,打破了 56 年未能突破的計(jì)算效率,將 4×4 復(fù)值矩陣運(yùn)算次數(shù)從49 降至48。此外,它還優(yōu)化了 Google 數(shù)據(jù)中心的計(jì)算資源調(diào)度,提高了 AI 訓(xùn)練效率,節(jié)約了0.7%的算力資源,它還改進(jìn)Gemini的大規(guī)模矩陣運(yùn)算算法,最終使整體訓(xùn)練時(shí)間縮短了1%。
https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
集智俱樂(lè)部關(guān)于AlphaEvolve的報(bào)道:
AlphaEvolve 系統(tǒng)本質(zhì)是在模擬生物進(jìn)化的過(guò)程來(lái)優(yōu)化程序生成(圖9)。其中提示采樣器(prompt sampler)就像是“環(huán)境選擇壓力”,它根據(jù)當(dāng)前最優(yōu)秀的程序來(lái)構(gòu)造新的提示;語(yǔ)言模型則充當(dāng)“基因變異”的角色,基于這些提示產(chǎn)生新的程序變體;評(píng)估器相當(dāng)于“自然選擇”機(jī)制,判斷哪些程序表現(xiàn)更好;而程序數(shù)據(jù)庫(kù)就是“基因庫(kù)”,保存著經(jīng)過(guò)篩選的優(yōu)秀程序,并通過(guò)進(jìn)化算法決定哪些“基因”(程序)應(yīng)該被傳遞到下一代。
圖9 AlphaEvolve 提示采樣器的工作流程:首先給語(yǔ)言模型組裝提示,然后語(yǔ)言模型生成新的程序。這些程序由評(píng)估器進(jìn)行評(píng)估并存儲(chǔ)在程序數(shù)據(jù)庫(kù)中。該數(shù)據(jù)庫(kù)實(shí)現(xiàn)了一種進(jìn)化算法,用于確定哪些程序?qū)⒈挥糜谖磥?lái)的提示生成。
由此可見(jiàn),AlphaEvolve 的出現(xiàn)已經(jīng)向AGS邁出了重要一步,它已經(jīng)相當(dāng)于達(dá)到了缺乏物理和實(shí)驗(yàn)操作的AGS大約3-4級(jí)水平。
總之,AGS代表了科學(xué)研究徹底轉(zhuǎn)變的重要一步。就像顯微鏡和望遠(yuǎn)鏡如何擴(kuò)展了我們觀察微觀和宏觀世界的能力,這些自主系統(tǒng)可能會(huì)擴(kuò)展我們進(jìn)行科學(xué)探索的范圍和速度。這不僅是科學(xué)工具的演變,更是科學(xué)本身的轉(zhuǎn)變——將科學(xué)探索的邊界推向前所未有的高度,開(kāi)創(chuàng)更高效、更具創(chuàng)新性的科學(xué)研究方法,超越當(dāng)前限制,最終加速整個(gè)人類文明的進(jìn)步。
本文為科普中國(guó)創(chuàng)作培育計(jì)劃作品 作者:十三維 審核:張江 北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院教授 出品:中國(guó)科協(xié)科普部 監(jiān)制:中國(guó)科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司
AI驅(qū)動(dòng)的計(jì)算醫(yī)學(xué)前沿研討會(huì)
生命科學(xué)與醫(yī)學(xué)領(lǐng)域正經(jīng)歷著深刻的智能革命。大語(yǔ)言模型與多智能體技術(shù)快速發(fā)展,正在推動(dòng)形成計(jì)算醫(yī)學(xué)(Computational Medicine)新范式,為精準(zhǔn)醫(yī)療、疾病診斷和健康管理開(kāi)辟全新路徑。AI驅(qū)動(dòng)的計(jì)算醫(yī)學(xué)在自主探索、跨尺度數(shù)據(jù)融合、個(gè)體建模與數(shù)字孿生等方面快速發(fā)展,然而跨學(xué)科合作與方法論整合仍是重要挑戰(zhàn)。
為此,DAMO開(kāi)發(fā)者矩陣(由阿里巴巴達(dá)摩院和中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)聯(lián)合發(fā)起)與集智俱樂(lè)部共同主辦,邀請(qǐng)多位國(guó)內(nèi)外前沿學(xué)者與業(yè)界專家分享交流。系列研討會(huì)將系統(tǒng)梳理計(jì)算醫(yī)學(xué)與AI交叉領(lǐng)域的最新進(jìn)展,自2025年7月6日(周日)開(kāi)始,共5大議題分享與討論。歡迎相關(guān)研究、應(yīng)用領(lǐng)域的朋友報(bào)名參加,共同推動(dòng)生命科學(xué)與醫(yī)療健康的智能未來(lái)!
本活動(dòng)免費(fèi)報(bào)名,實(shí)行審核入群制,請(qǐng)?zhí)顚?xiě)信息后入群參與交流并獲得每期活動(dòng)信息。
詳情請(qǐng)見(jiàn):
具身智能讀書(shū)會(huì)
集智俱樂(lè)部聯(lián)合上海交通大學(xué)助理教授李永露、銀河通用機(jī)器人合伙人史雪松、南京大學(xué)LAMDA組博士生陳雄輝、香港大學(xué)在讀博士生穆堯,共同發(fā)起首季。讀書(shū)會(huì)計(jì)劃采用“自下而上”的層級(jí)結(jié)構(gòu),探討四個(gè)核心模塊:硬件系統(tǒng)(機(jī)器人本體設(shè)計(jì)),數(shù)據(jù)、仿真環(huán)境與Benchmark,機(jī)器人學(xué)習(xí),具體場(chǎng)景任務(wù)。希望通過(guò)重點(diǎn)討論經(jīng)典、前沿的重要文獻(xiàn),幫助大家更好地學(xué)習(xí)機(jī)器人與具身智能技術(shù)前沿技術(shù),為相關(guān)領(lǐng)域的研究和應(yīng)用提供洞見(jiàn)。讀書(shū)會(huì)已完結(jié),現(xiàn)在報(bào)名可加入社群并解鎖回放視頻權(quán)限。
詳情請(qǐng)見(jiàn):
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.