摘要
對地球系統的可靠預測是減輕自然災害、支持人類發展的重要基礎。盡管傳統數值模型功能強大,但其計算成本極高。人工智能(AI)的最新進展已顯示出在提升預測性能和效率方面的潛力,但在許多地球系統領域中,其潛力仍未得到充分挖掘。本文提出的Aurora模型,通過超過一百萬小時的多源地球物理數據訓練,構建了一個大規模基礎模型。在空氣質量預測、海浪預報、熱帶氣旋路徑追蹤和高分辨率天氣預報方面,該模型不僅顯著超越現行業務預報系統,計算成本卻降低了數個量級。憑借以較低成本即可針對不同應用進行微調的優勢,Aurora標志著人類向普及高精度、高效率的地球系統預測邁出了重要一步。這些突破性成果彰顯了人工智能在環境預測領域的變革潛力,為更廣泛獲取高質量氣候與氣象信息開辟了新路徑。
關鍵詞:地球系統預測(Earth system prediction)、基礎模型(Foundation Model)、Aurora、人工智能(AI)、空氣質量預測(air quality forecasting)、海浪預報(ocean wave modeling)、熱帶氣旋追蹤(tropical cyclone tracking)、高分辨率天氣預報(high-resolution weather forecasting)
彭晨丨作者
論文題目:A foundation model for the Earth system 論文鏈接:https://www.nature.com/articles/s41586-025-09005-y 發表時間:2025年5月21日 論文來源:Nature
地球系統預測是應對自然災害和保障人類社會發展的重要工具,但傳統數值模型依賴超級計算機和復雜的物理方程,計算成本高昂且改進緩慢。近年來,AI技術雖在天氣預報等領域初露鋒芒,但在海洋動力學、大氣化學等關鍵領域仍存在空白。2025年5月,Nature 雜志報道了微軟研究院團隊開發的Aurora——首個覆蓋多領域的地球系統基礎模型,其在空氣質量、海浪、熱帶氣旋路徑和高分辨率天氣預測中均超越傳統模型,計算效率提升達十萬倍,為環境預測的民主化邁出關鍵一步。
Aurora架構:統一編碼的3D時空建模
Aurora的核心設計靈感源于自然語言和多模態基礎模型,包含三大模塊:
三維感知編碼器(3D Perceiver encoder):將不同分辨率、變量(如溫度、氣壓)和壓力層的數據映射為統一的三維潛空間表示,通過傅里葉編碼捕捉空間位置和尺度特征。
三維Swin Transformer處理器:采用層級式窗口注意力機制,模擬地球流體動力學中的局部相互作用,并通過U-Net結構實現多尺度特征融合。
動態解碼器:將潛變量反向映射為任意目標變量和分辨率的預測結果,支持缺失數據建模(如海浪數據在陸地上的空白)。
圖 1. Aurora是一個包含13億個參數的地球系統基礎模型。a, Aurora在不同分辨率、變量和壓力水平的多個異構數據集上進行預訓練。然后對模型進行微調,以適應不同分辨率的幾種業務預測情景:0.4°的大氣化學和空氣質量,0.25°的波浪模擬,0.25°的颶風跟蹤和0.1°的天氣預報。b,Aurora是一個靈活的3D旋轉變壓器,具有基于3D感知器的大氣編碼器和解碼器。該模型能夠提取具有不同空間分辨率、壓力水平和變量數量的輸入。
這種“預訓練-微調”范式使Aurora能夠從百萬小時異構數據(包括氣候模擬、再分析和實時預報)中學習通用規律,僅需2.5周預訓練即可快速適配下游任務。
突破性應用:從污染到颶風的全面超越
空氣質量預測
傳統大氣化學模型需解算數百個剛性方程,而Aurora在CAMS數據集上微調后,5天全球空氣質量預測(0.4°分辨率)在74%指標上超越傳統模型。例如,2022年中東沙塵暴事件中,Aurora提前24小時準確預測PM10濃度峰值,與耗資巨大的數值模擬結果高度一致,耗時僅0.6秒/預測步長。
圖 2.在實際操作環境中,Aurora在大多數比較中與CAMS相匹配或優于CAMS,而計算成本要小得多。a,Aurora對TC NO2的預測準確地預測了CAMS分析。由于大氣氣體的空間異質性,對其進行正確預測極具挑戰性。特別是,與大多數空氣污染變量一樣,二氧化氮在人為排放大的地區(如東亞人口稠密地區)傾向于高值。NO2表現出強烈的日循環;例如,陽光通過一種稱為光解的過程降低背景二氧化氮水平。Aurora準確地捕捉到了極端和背景水平。Aurora和CAMS25預報是在2022年9月1日00 UTC用CAMS分析初始化的。b、在所有預測時間中,Aurora在74%的目標上達到或超過CAMS。c、在3天的預測時間內,Aurora在89%的變量上與CAMS匹配或優于CAMS。
海浪預報
針對海浪方向譜和風浪耦合的復雜性,Aurora在HRES-WAM數據中引入“密度通道”標記缺失值,10天海浪預報(0.25°分辨率)在86%指標上優于歐洲中期天氣預報中心(ECMWF)的高分辨率模型。2022年臺風“南瑪都”期間,其預測的顯著波高和平均波向與實測誤差不足5%。
圖 3. 在實際操作中,在大多數對比中,Aurora與HRES-WAM相匹配或優于HRES-WAM。a,Aurora準確預測了2022年最強烈的熱帶氣旋——臺風南瑪都的重要波高和平均波向。紅框表示臺風的位置,數字是高峰有效波高。Aurora的預測和HRES-WAM分析是針對2022年9月17日12 UTC,當時臺風南瑪都達到峰值強度。b、在所有的預測時間中,極光在86%的波動變量上與HRES-WAM匹配或優于HRES-WAM。c、在3天的預測期內,Aurora在91%的地表變量上與HRES-WAM匹配或優于HRES-WAM。
熱帶氣旋追蹤:單模型擊敗人類專家共識
傳統颶風路徑預測依賴多模型集成和人工修正,而Aurora在未針對氣旋微調的情況下,僅通過海平面氣壓場的最小值追蹤,即在大西洋、西北太平洋等區域5天路徑預測中全面超越七大官方機構。以2023年臺風“Doksuri”為例,Aurora提前4天準確預測菲律賓登陸,而多數官方模型誤判為臺灣海峽通過。
圖 4. Aurora比世界上幾個機構和地區的最先進的熱帶氣旋預測系統表現更好。a,Aurora在不同地區比幾個機構獲得更好的軌道預測MAE。官方預測由OFCL、PGTW、CWA、BABJ、RJTD、RKSL和BoM(黑體)提供。對于北大西洋和東太平洋,我們還比較了創建OFCL時使用的各種模型(非粗體)。模型并不總是進行預測,這意味著對不同的數據計算不同的列。因此,列并不表示模型性能,而僅表示與Aurora相比的性能。這里的“≈”表示單元格的95%置信區間包含零。平均而言,Aurora在北大西洋和東太平洋地區比其他機構好20%,在西北太平洋地區好18%,在澳大利亞地區好24%。b、七月二十一日,一個熱帶低氣壓增強為熱帶風暴,并命名為臺風“Doksuri”。臺風“Doksuri”將成為迄今為止最“昂貴”的太平洋臺風,造成超過280億美元的損失。黑線表示從ibtracs中提取的真地路徑。Aurora準確預測臺風“Doksuri”將在菲律賓北部登陸,而PGTW則預測它將經過臺灣。
0.1°天氣預測:極端天氣的精細刻畫
現有AI天氣模型局限于0.25°分辨率,Aurora通過融合2016年后的0.1°數據,首次在10天預報中實現92%變量超越ECMWF的HRES系統。2023年歐洲風暴“夏蘭”期間,Aurora精準捕捉35.2 m/s的陣風峰值,而其他AI模型均低估強度,驗證了其對小尺度對流過程的建模能力。
通向地球數字孿生的鑰匙
Aurora的突破不僅在于性能提升,更在于其低成本可擴展性:每個下游任務的微調僅需4-8周,而傳統模型開發需數年。未來,通過集成觀測數據同化(data assimilation)和物理約束,Aurora有望實現“端到端”預測,并擴展至海冰、生態等場景。研究團隊指出,模型的“黑箱”特性仍是挑戰,但初步可視化顯示,其注意力機制能夠自發捕捉急流、渦旋等關鍵氣象結構。隨著計算與數據規模的持續擴展,地球系統的數字孿生或將走進現實。
推薦讀書會
集智俱樂部「」主題讀書會中,葉杰平教授介紹了一個面向地球科學家的開源大語言模型GeoGPT,該模型基于領先的開源大型語言模型構建,具備多項核心能力,包括從地球科學文獻中提取關鍵信息、實現問答交互、進行邏輯推理、自動生成代碼以及開展數值計算與分析。本次分享老師對GeoGPT架構進行了詳細介紹,并分享他們的開發經驗與使用方法。感興趣的朋友可以掃碼查看視頻:
地球系統科學讀書會
世界氣象組織《2023年全球氣候狀況》報告確認2023年是有觀測記錄以來最暖的一年。氣候變化正在以高溫、干旱、洪水、野火和沙塵暴等極端天氣的形式吸引人們的廣泛關注。世界經濟論壇《2024全球風險報告》將氣候變化作為首要值得關注的風險。地球作為一個多要素、非線性的開放復雜系統,要素間相互作用關系復雜,往往牽一發而動全身。在人類活動深刻影響下,我們該如何理解并有效應對正在面臨的氣候變化以及其帶來的社會經濟等一系列議題,實現人類與地球的可持續發展?
為了能夠深入理解人類世背景下地球系統各要素之間復雜的相互作用與演化機制,并為人類應對未來的地球系統科學重大挑戰提供一套科學的認知框架,集智俱樂部聯合清華大學講席教授陳德亮、北京師范大學教授樊京芳、東莞理工學院特聘副研究員陳愛芳、南開大學副教授戴啟立老師和愛爾蘭都柏林大學博士生班嶄共同發起,將組織大家從新的研究范式出發梳理相關文獻,并深入研讀其中涉及的理論與模型。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.