為推進AI在科學中的應用,歐盟開展了科學AI國家政策互學互鑒(Mutual Learning Exercise on National Policies for AI in Science)研究項目,并分別于2025年2月24日和4月15日發布《科學AI基礎設施》與《科學AI人才》兩份報告,總結了參與該項目國家科學AI的現狀與挑戰,并提出了政策建議。兩份報告的主要內容概述如下。
一、戰略背景
在該研究中,科學AI(AI in science)指的是利用AI來改進和加快各學科的研究,涵蓋了從個人研究人員使用傳統機器學習(ML)技術和大型語言模型(LLM),到能夠自行進行實驗和分析數據的更先進的系統。
該研究指出,最近的AI進展正在改變材料科學、藥物設計、量子物理和醫學等領域研究人員的工作方式,使研究更有效,更有能力應對氣候變化和流行病等挑戰。AI在科學中的根本影響是降低科學研究的經濟成本:科學的智力部分現在由人類和AI完成,而實驗部分現在由人類和實驗室機器人完成。
目前AI由美國和中國的大型科技公司主導,任何一家歐洲公司無法競爭,這是歐洲的一個根本戰略關切。
雖然AI的能力尚未被完全理解,但AI顯然有潛力大幅提升科研速度和效率。科學是技術的基礎,技術是社會的基石。歐洲衛生、經濟和軍事安全需要具有國際競爭力的技術。
二、科學AI基礎設施
第一份報告分析了AI基礎設施中的三個主題:高性能計算、科學數據、AI基礎設施前沿(基礎模型和AI科學家)。
1.高性能計算(HPC)
高性能計算指的是各種大型計算設施,傳統超級計算機、基于云的集群、基于圖形處理器(GPU)的學習和推理系統等。盡管歷史上高性能計算與AI各自獨立發展,但GPU硬件的改進推動了兩者的融合,進而推動了深度學習的突破。這種融合越來越需要大量的計算和數據資源。
歐盟對高性能計算的主要支持是EuroHPC,它是歐盟、歐洲國家和私人合作伙伴于2018年共同發起的一項倡議,旨在在歐洲建立一個世界級的超級計算生態系統。EuroHPC聯合執行體(JU)有兩個主要目標:建立泛歐超級計算基礎設施,支持高性能計算的研究和創新,總部設在盧森堡市,于2018年11月在歐盟委員會監督下開始運營,并于2020年獲得自治權,由成員共同資助,2021-2027年的預算約為70億歐元。然而與美國和中國相比,EuroHPC的高性能計算能力要小得多。
EuroHPC聯合執行體當前的一項重要舉措是“AI工廠計劃”(AI Factories call),旨在通過整合AI成功的三個關鍵要素即計算能力、數據和人才創建一個蓬勃發展的歐洲生態系統,用于訓練先進的AI模型和開發AI解決方案。“AI工廠”將實現互聯互通,并向歐洲AI初創企業、行業和研究人員開放。
該報告指出,在過去的幾年里,AI通過ChatGPT等大語言模型(LLM)的發展已經發生了改變。LLM的成功驗證了"規模化假說"(scaling hypothesis),即機器學習模型(尤其是神經網絡等深度學習模型)的性能會隨著其規模、訓練數據量和計算資源的增加而呈現可預測的提升。
基于對該假說持續有效的預期,以中美兩國科技巨頭為主,全球約有萬億美元資金在向新型高性能計算(HPC)領域投入。然而,由于經濟、技術和環境的限制,這一假設可能會趨于穩定。如果規模化假設被證偽,那么當前中美科技巨頭在AI超算領域的巨額投入,其技術前瞻性或將淪為如同18世紀在齋浦爾建造的簡塔·曼塔天文臺巨型日晷——當時機械鐘表已明確成為計時技術發展方向。在此情境下,AI的未來突破將不得不依賴于更高效的機器學習方法或硬件架構的創新。
該報告希望“規模化假設”不再持續有效,因為一是歐洲無法通過規模化推動AI的強力發展,二是計算基礎設施所使用的全球能源份額正在迅速上升,而為擴展AI而構建大量新的高性能計算資源將使這一情況更加惡化。
該報告對發展高性能計算提出如下政策建議:
——加大對高技能計算資源的投入;
——參與AI工廠計劃;
——優先開發更小更節能的AI系統;
——研究將歐洲結構和投資基金(ESIF)作為資金來源;
——高性能計算實踐必須優先考慮能源效率和可持續性;
——對國家和歐洲一級存在的HPC軟件差距和資產進行盤點;
——將AI和高性能計算整合到教育和培訓計劃中,引入融合AI和高性能計算的跨學科碩士和博士課程,建立正式的培訓計劃面向研究人員、行業專業人員和私營部門開放,以建立健全人才管道。
——加強泛歐合作,共享基礎設施、專業知識和最佳實踐,培育合作文化;
——平衡產學研合作。
2.數據
科學AI數據基礎設施指的是數據存儲庫、數據共享平臺、模型共享平臺等。AI的最新進展不僅得益于高性能計算的利用,也得益于海量數據的獲取。數據在科學AI中也同樣重要。例如,如果沒有對蛋白質序列和結構數據庫的開放訪問,AlphaFold就不可能實現。
歐洲開放科學云(EOSC)是歐盟推出的促進研究數據共享的重要行動之一,其目標是為歐洲研究人員、創新者、公司和公民提供一個聯合和開放的多學科環境,他們可以在其中發布、查找和重用數據、工具和服務,用于研究、創新和教育目的。另外,歐盟還在開發14個部門/領域的通用歐洲數據空間(Common European Data Spaces)。
該報告對推進科學AI數據基礎設施也提出了政策建議,包括:
——優先考慮互操作性和跨學科協作,以最大限度地發揮共享數據的價值;
——改進培訓并加大對專門支持崗位的資金投入至關重要;
——應該考慮加強對數據共享的激勵,并簡化流程,建立獎勵制度,以認可研究人員對開放數據存儲庫的貢獻。
——歐洲開放科學云應得到擴展和標準化,以充分發貨會其潛力;
——AI有潛力從教科書、科學論文和研究成果中提取明確的可執行知識,從而豐富數據基礎設施。這一領域的AI研究應該得到支持。
3.基礎模型
基礎模型是一種基于廣泛數據訓練的AI模型,因此可以進行調整并應用于廣泛的應用程序。基礎模型旨在通過允許大型、適應性強的模型從大量數據集中學習,從而徹底改變科學研究。鑒于生物、化學和物理系統的復雜性,這項技術在解決生物學和醫學領域的關鍵挑戰方面擁有巨大潛力。
科學基礎模型是一種非常有前景的途徑,可以為加速科學研究提供基礎設施,對社會科學也很有價值,例如通過加強調查研究、在線實驗、基于主體的模型和其他通常用于研究人類行為的技術。
該報告認為,需要公共領域的基礎模型。而一個值得注意的倡議是萬億參數聯盟(Trillion Parameter Consortium):一個新的國際聯盟,旨在為科學創建值得信賴和可靠的生成式AI模型。
對推進基礎模型發展,該報告提出了如下建議:
——對基礎模型的基礎設施(高性能計算和數據)的戰略投資至關重要,擴展高性能計算和數據基礎設施以支持科學基礎模型的訓練和推理是必要的。
——跨學科合作和有針對性的培訓項目將有助于最大限度地發揮基金會模型的效用。需要教育舉措來連接AI、高性能計算和各個科學學科,培養一支熟練利用這些先進工具的勞動力隊伍。還應鼓勵跨機構和國家的合作研究,將基礎模型與假設生成和實驗驗證相結合,推動跨多個研究領域的突破。
——有必要為歐洲科學家提供平等的獲得基礎模型的渠道。應促進數據和模型的開放共享,確保廣泛參與,使各行各業和各地區的研究人員能為AI驅動的科學進步做出貢獻。
——需要開發通用的、可信的基礎模型,這些模型必須閱讀并理解科學文獻,理性地比較和整合所有科學文獻中相互矛盾的陳述,能夠產生有充分根據的新假設和理論,并能夠提出最有效的實驗來推動科學發展。
——有必要監控并盡量減少影響期刊、審稿人、編輯和科學讀者的科學不端行為。應促進健全的制度和對研究過程的獨立審計,以發現和防止欺詐或不道德行為,從而維護科學誠信。
5.AI科學家
科學AI最先進的是“AI科學家”(也被稱為“機器人科學家”、“自動駕駛實驗室”、“自主發現系統”、“機器科學家”等)。這些AI系統與實驗室自動化相集成,實現了科學研究的閉環自動化。AI科學家最早起源于歐洲。然而,在對AI科學家的投資方面,歐洲遠遠落后于美國和加拿大。
2024年4月,歐盟委員會的科學咨詢機制(SAM)發布了關于如何促進整個歐盟在研究和創新中采用AI的獨立政策建議,其中與AI科學家相關的內容是“建立歐洲分布式AI科學研究所”。該建議指出,“為了對抗少數公司對AI基礎設施的主導地位,并賦能跨學科的公共研究,科學家們建議成立一個新的研究所。”歐盟委員會主席馮德萊恩也表達了類似的觀點,提議成立“歐洲AI研究理事會”(European AI Research Council)。
其他一些機構如歐洲人工智能研究實驗室聯合會(CAIRNE)、未來世代中心(CFG)同樣有此建議,即成立像歐洲核子研究組織(CERN)的AI研究所(CERN for AI in Science)。
該報告呼吁推動這樣的AI研究所成為現實,認為這將使歐洲有可能主導下一次科學技術革命,從而保障歐洲的健康、經濟安全和軍事安全。
該報告就AI科學家發展同樣提出了一些政策建議,包括:
——應考慮為資助一項大規模的科學AI計劃,并探討構建這種計劃的最佳方式;
——加強實驗室硬件和軟件的互操作性對于提高采用率和可用性至關重要,特別是在多學科和協作研究環境中;
——需要有針對性的教育舉措、新的學術課程設置以及吸引該領域全球人才的激勵措施;
——歐洲應該參與并支持國際努力,以減輕AI在科學中使用的風險;
——需要支持機器人科學,以解決當前在實現更高水平的自動化和增強實驗室內執行任務的普遍性方面的挑戰。
第一份報告最后指出,歐洲目前在科學AI領域仍具有國際競爭力,但必須迅速采取行動,以保持其競爭優勢。
科學AI競賽是歐洲未來繁榮的核心,目前主導AI的美國和中國的大型科技公司并未在科學領域占據優勢,因為科學需要實驗室和設備,而大型科技公司只能有限地獲得這些實驗室和設備。相比之下,歐洲科學界擁有必要的科學專業知識,以及廣泛的學術和工業科學實驗室和設施網絡。這些人才和設備比大型科技公司高出幾個數量級。歐洲還有一個優勢,那就是擁有大量的實驗室自動化產業。
三、科學AI人才
第二份報告從吸引和留住技術人才、提供培訓、鼓勵跨領域團隊合作、構建立公私組織伙伴關系以及改善AI教育等方面進行了分析。
該報告指出,AI工具的日益普及引發了人們的疑問:未來的科學家是否需要深厚的機器學習專業知識,或者AI素養和提示工程是否足以滿足許多應用的需求。這種快速轉變需要一種適應性強、具有前瞻性的教育方法,以確保研究人員始終具備相關技能。因此,一個關鍵的政策考量是建立敏捷、響應迅速的教育體系,以持續適應新興的AI能力和研究需求。
1.科學AI人才的吸引和留住
報告指出,吸引和留住人才對于推進AI在科學領域的應用至關重要。在這種情況下,“人才”包括各種技能組合,包括AI研究;將現有AI工具應用于其他科學領域;研究、軟件和數據工程;科學學科的數據管理;以及重要的“橫向”能力,如團隊合作、溝通和負責任的創新。
隨著AI在解決復雜科學問題中發揮越來越大的作用,對能夠有效開發和應用AI工具的高技能專家的需求越來越大(從這個意義上說,專家可以是:人工智能/機器學習研究人員、數據科學家、數據工程師、數據管理員、科學軟件開發人員、領域科學家等)。
該報告建議為了了營造一個更具支持性和可持續性的AI人才環境,政策制定者應關注以下幾點:
——有針對性的AI研究資金,專門支持以AI為重點的職業發展、培訓和跨學科研究;
——精簡行政程序,減少在招聘和撥款申請方面的官僚延誤;
——簡化簽證政策,促進國際流動,吸引和留住全球AI人才;
——明確的人才留住政策,包括結構化的職業發展、終身職位和激勵措施等;
——提高研究人員的工資,以提高他們相對于私營部門的競爭力,并留住和吸引人工智能和科學人才。
2.AI教育與課程融合
報告指出,教育是建立強大的AI科學人才庫的基礎。為了滿足科學研究中對AI專業知識日益增長的需求,將AI教育融入到從小學到大學的課程中至關重要。早期接觸AI概念有助于培養興趣和發展基本技能;此外,這些舉措可以鼓勵不同人群更廣泛地參與,從而有助于克服STEM領域的性別刻板印象。高等大學課程應該讓學生掌握跨學科研究所需的專業知識。
關鍵挑戰之一是AI技術的快速發展,要求教育系統更加敏捷和響應迅速。AI課程,特別是在大學和專業培訓階段,必須經常更新,以反映基礎模型、生成式AI和倫理考慮等新興趨勢。如果沒有持續的課程修訂,AI教育可能會過時,導致研究人員和專業人員對現實世界的AI應用毫無準備。
就加強AI教育與課程融合,該報告提出了如下建議:
——將AI和計算思維的主題納入中小學教育;
——將大學AI教育從計算機科學擴展到各門科學學科;
——開發靈活、模塊化的AI課程,讓不同背景的學生在各階段教育都能獲得AI技能;
——支持AI終身學習和專業發展,特別是需要將AI融入到工作中的研究人員;
——加強公私伙伴關系,創造實用的AI培訓機會,確保研究人員獲得AI應用的實踐經驗;
——鼓勵跨大學合作,使學生能夠從多個大學學習AI課程。
——鼓勵科學家與公眾接觸,揭開AI的神秘面紗,并促進有關其社會影響的知情討論;
——通過定期重新評估和更新課程內容,確保教育系統的敏捷性和響應性。這可能包括定期審核AI課程和模塊化學習結構,以便快速適應技術進步。
3.培訓和技能提升
報告指出,培訓和提高技能對于發展和維持一個強大的AI科學人才庫至關重要。隨著AI技術的快速發展,研究人員和專業人員需要持續的學習機會,以掌握最新的工具和方法。提供便捷有效的培訓項目,確保科學家能夠以創新的方式應用AI來應對復雜的挑戰。
針對培訓和技能再提升,該報告提出如下政策建議:
——改革評估標準,在進行研究和教學績效評估時,承認AI培訓工作是有價值的(但非強制性);
——引入培訓師培訓計劃,并與AI專業機構開展教師交流;
——擴大國家人工智能基礎設施,以提供計算能力和結構化培訓;
——為AI課程提供補助和補貼,類似于奧地利的“數字奧地利”計劃,該計劃為研究人員的AI培訓項目提供資金;
——國家和歐洲研究資助機構應將AI培訓成本納入研究資助。
4.跨學科AI研究和職業發展
報告指出,跨學科研究對于推進AI在科學領域的發展至關重要,因為它可以將AI工具和技術整合到生物學、物理學和環境科學等領域。這種合作有望在解決復雜的科學問題方面取得突破。然而,要實現這一目標,需要刻意努力培育跨學科方法,并創造可持續的職業發展道路,鼓勵科學家跨領域參與。同時,必須承認跨學科研究本身就具有挑戰性,而且不一定總是成功。
促進跨學科研究的良好舉措包括:為匯聚AI專家和領域科學家的項目設立專項資助計劃,建立跨學科研究中心,以及提供將AI與科學學科相結合的聯合學術項目。職業發展可以通過認可和獎勵學術和機構環境中的跨學科工作,提供指導機會,以及提供靈活的職業道路來連接學術界,工業界和公共研究機構來支持。
就跨學科AI研究和職業發展,該報告提出如下政策建議:
——國家研究資助機構應該引入跨學科的AI資助計劃;
——資金申請應該明確要求AI研究人員和領域專家之間的合作;
——評估流程應進行調整,以納入審查小組的跨學科專業知識;
——大學應該在課程中融入AI,以促進跨學科學習;
——AI培訓應融入STEM和社會科學學科,以培養跨學科AI素養;
——博士和博士后課程應該從一開始就支持跨學科的AI研究。早期職業研究人員應該與來自AI和領域科學的導師結對;
——制定更清晰的學術和行業路徑,鼓勵跨領域流動不受處罰;
——AI研究應納入國家科學戰略。政府應確保AI成為國家研究議程的核心組成部分,并促進跨領域合作;
——跨學科項目的評估應考慮到跨領域整合的內在挑戰,并容忍失敗,特別是在早期階段。
5.公私伙伴關系和國際合作
報告指出,公私合作和國際合作對于培養和留住科學AI人才至關重要。在科學領域推進AI的挑戰,如獲取資源、資金和尖端專業知識,需要跨部門和跨國界合作。學術界、產業界和政府之間的合作可以彌合資源缺口,提供實際經驗,并為人才發展創造新的機會。同樣,國際合作促進了知識交流、利用全球研究基礎設施以及匯集人才,以應對復雜的科學挑戰。
針對合作伙伴關系建立,該報告提出如下建議:
——政府應積極推動學術機構、私營公司和研究機構之間的結構化合作,以培養AI人才和提升研究能力。這可能包括共同資助的AI研究項目、行業贊助的博士課程,以及由學術界和產業界主導的AI培訓項目;
——確保所有學科都能獲得公私合作的AI培訓項目;
——國家和歐盟層面的研究資助機構應引入明確支持跨境AI研究合作和跨學科AI應用的資助項目,促進AI人才的知識共享和流動;
——政府應投資AI研究基礎設施,如高性能計算資源、云平臺和開放訪問數據集,確保學術和行業研究人員擁有有效合作的必要工具;
——決策者應確保將AI作為國家研究戰略的核心組成部分,這需要不同科學學科之間以及公共和私營部門之間的合作。這可能包括建立促進大學和產業界合作的國家人工智能中心;
——稅收激勵、補貼和資助計劃應鼓勵私營公司投資與大學的AI研究合作,共同開發培訓計劃,并為AI研究人員提供行業實習機會;
——AI人才受益于跨部門的多元化經驗。政府應該建立流動性計劃,允許研究人員跨大學、私營企業和國際研究機構工作,確保跨行業知識轉移;
——國家和國際政策應鼓勵企業和研究機構共享AI工具、數據集和研究成果,以促進開放科學原則。這將促進更廣泛的合作,并加速AI在科學領域的進步;
——政府和大學之間基于績效的資助協議應包括對AI培訓計劃的要求,確保高等教育機構優先考慮跨學科的AI技能提升;
——許多AI研究合作目前都與短期項目有關,影響有限。政府和資助機構應鼓勵學術界和產業界建立多年的AI合作伙伴關系,為AI研究和勞動力發展提供穩定和持續的投資。
第二份報告最后指出,AI人才是科學進步的戰略必需品。政府、研究機構和產業界需要協調一致,建立一個有利于AI人才茁壯成長的生態系統。通過實施上述建議,歐洲國家可以創建一支可持續和有競爭力的AI勞動力隊伍,以應對未來的科學挑戰。
資料來源:
1.European Commission(2025). Infrastructures for AI in science : mutual learning exercise on national policies for AI in science : second thematic report. https://data.europa.eu/doi/10.2777/8581577
2.European Commission(2025). Talent for AI in science : mutual learning exercise on national policies on AI in science. https://data.europa.eu/doi/10.2777/8779512
[本文為中國教育科學研究院國際教育研究中心承擔的教育部高校國別和區域研究2024年課題研究成果]
本文由中國教育科學研究院張永軍副研究員整理,編輯劉強。內容僅供參考,點擊左下角“閱讀原文”可下載該文獻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.