編輯丨王多魚
排版丨水成文
新冠大流行期間,一份實時更新 的“全球新冠疫情數據可視化地圖”火遍全球,該疫情地圖 通過結合自動化數據采集與人工審核機制,成為全球多個國家政府、媒體引用最廣泛的疫情追蹤系統之一,單日訪問量一度高達 20 億。
這一地圖的開發者是約翰·霍普金斯大學的兩位中國留學生——董恩盛、杜鴻儒。
近日,杜鴻儒作為第一作者,在 Nature 子刊Nature Computational Science上發表了題為:Advancing real-time infectious disease forecasting using large language models 的研究論文。
該研究開發了一款多模態大型語言模型——PandemicLLM,通過融合多模態信息(包括文本形式的公共衛生政策以及基因組監測、空間和流行病學時間序列數據),采用人工智能與人類協作的提示詞設計,來實時預測疾病傳播。研究團隊將該模型應用于美國的 COVID-19 疫情,預測性能顯著優于現有模型。
該研究讓大語言模型(LLM)化身疫情預報員,成功突破傳統模型瓶頸,不僅能看懂政策文本、基因報告,還能提前 3 周預警疫情反撲,這項研究或將重塑公共衛生決策模式。
傳統模型的“致命短板”
論文開篇直指現有疫情預測模型的四大痛點:
1、數據盲區:傳統模型只能處理數字(例如病例數),對政策文本、病毒基因特征等關鍵信息“視而不見”;
2、變種響應慢:當奧密克戎新亞型 BQ.1 出現時,傳統模型需重新訓練,錯過黃金預警期;
3、結果難解讀:復雜的置信區間讓決策者難以快速判斷風險等級;
4、轉折點誤判:三分之二的模型曾在疫情拐點預測中失誤。
革命性突破:把疫情預測變成“文本推理題”
該團隊開發的 PandemicLLM 框架,創造性地實現三大突破:
1、多模態數據“翻譯官”,通過 AI-人類協作提示詞,將四類異構數據轉化為模型能理解的“語言”:
政策文本 → 提煉防控力度變化(例如“學校從強制關閉轉為建議關閉”);
基因監測 → 解析病毒特性(例如“BQ.1 變種傳播力比 BA.5 高 40%”);
時空數據 → 轉化為排名描述(例如“加州老年人口比例全美前五”);
時間序列 → 用 GRU 神經網絡編碼關鍵趨勢。
2、首創“五級趨勢分類法”,摒棄易受數據干擾的數值預測,采用疾控中心認可的住院趨勢五級分類:大幅下降、溫和下降、穩定、溫和上升、大幅上升,讓決策者一眼可知風險等級。
3、“零樣本”應對新變種,當 BQ.1 變種出現時,無需重新訓練模型,只需在提示詞中添加其特性描述:BQ.1 是奧密克戎亞型,對免疫逃逸能力增強,預計兩周內成為主流毒株。模型立即響應,預測準確率提升 28.2%。
PandemicLLM 的疫情數據流和處理流程概述
人工智能與人類協作提示詞設計概要
實戰表現:全美大考
在覆蓋全美 50 個州、長達 19 個月的測試中,PandemicLLM 的表現:
1、精度碾壓傳統模型
1 周預測準確率 56%(比最優傳統模型高20%);
3 周預測準確率 46.4%(誤差率降低22%);
模型規模越大表現越好:700 億參數版本準確率達 57.1%。
2、置信度=可信度
當模型對“大幅上升”的判斷置信度>85% 時,實際發生概率高達 73%(1周)和 64%(3周)。
3、地域適應性
在疫情趨勢一致的西部沿海、五大湖區表現最佳,而在政策多變的懷俄明州等地區仍有優化空間,因此,團隊建議開發區域定制模型。
總的來說,這項研究不僅破解了多模態數據融合的難題,更開創了 AI 輔助公共衛生決策的新范式——下次疫情來襲時,決策者或許不再面對冰冷數字,而是獲得一份“風險趨勢解讀報告”。
論文鏈接:
https://www.nature.com/articles/s43588-025-00798-6
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.