編輯丨王多魚
排版丨水成文
新冠大流行期間,一份實(shí)時(shí)更新 的“全球新冠疫情數(shù)據(jù)可視化地圖”火遍全球,該疫情地圖 通過結(jié)合自動化數(shù)據(jù)采集與人工審核機(jī)制,成為全球多個(gè)國家政府、媒體引用最廣泛的疫情追蹤系統(tǒng)之一,單日訪問量一度高達(dá) 20 億。
這一地圖的開發(fā)者是約翰·霍普金斯大學(xué)的兩位中國留學(xué)生——董恩盛、杜鴻儒。
近日,杜鴻儒作為第一作者,在 Nature 子刊Nature Computational Science上發(fā)表了題為:Advancing real-time infectious disease forecasting using large language models 的研究論文。
該研究開發(fā)了一款多模態(tài)大型語言模型——PandemicLLM,通過融合多模態(tài)信息(包括文本形式的公共衛(wèi)生政策以及基因組監(jiān)測、空間和流行病學(xué)時(shí)間序列數(shù)據(jù)),采用人工智能與人類協(xié)作的提示詞設(shè)計(jì),來實(shí)時(shí)預(yù)測疾病傳播。研究團(tuán)隊(duì)將該模型應(yīng)用于美國的 COVID-19 疫情,預(yù)測性能顯著優(yōu)于現(xiàn)有模型。
該研究讓大語言模型(LLM)化身疫情預(yù)報(bào)員,成功突破傳統(tǒng)模型瓶頸,不僅能看懂政策文本、基因報(bào)告,還能提前 3 周預(yù)警疫情反撲,這項(xiàng)研究或?qū)⒅厮芄残l(wèi)生決策模式。
傳統(tǒng)模型的“致命短板”
論文開篇直指現(xiàn)有疫情預(yù)測模型的四大痛點(diǎn):
1、數(shù)據(jù)盲區(qū):傳統(tǒng)模型只能處理數(shù)字(例如病例數(shù)),對政策文本、病毒基因特征等關(guān)鍵信息“視而不見”;
2、變種響應(yīng)慢:當(dāng)奧密克戎新亞型 BQ.1 出現(xiàn)時(shí),傳統(tǒng)模型需重新訓(xùn)練,錯過黃金預(yù)警期;
3、結(jié)果難解讀:復(fù)雜的置信區(qū)間讓決策者難以快速判斷風(fēng)險(xiǎn)等級;
4、轉(zhuǎn)折點(diǎn)誤判:三分之二的模型曾在疫情拐點(diǎn)預(yù)測中失誤。
革命性突破:把疫情預(yù)測變成“文本推理題”
該團(tuán)隊(duì)開發(fā)的 PandemicLLM 框架,創(chuàng)造性地實(shí)現(xiàn)三大突破:
1、多模態(tài)數(shù)據(jù)“翻譯官”,通過 AI-人類協(xié)作提示詞,將四類異構(gòu)數(shù)據(jù)轉(zhuǎn)化為模型能理解的“語言”:
政策文本 → 提煉防控力度變化(例如“學(xué)校從強(qiáng)制關(guān)閉轉(zhuǎn)為建議關(guān)閉”);
基因監(jiān)測 → 解析病毒特性(例如“BQ.1 變種傳播力比 BA.5 高 40%”);
時(shí)空數(shù)據(jù) → 轉(zhuǎn)化為排名描述(例如“加州老年人口比例全美前五”);
時(shí)間序列 → 用 GRU 神經(jīng)網(wǎng)絡(luò)編碼關(guān)鍵趨勢。
2、首創(chuàng)“五級趨勢分類法”,摒棄易受數(shù)據(jù)干擾的數(shù)值預(yù)測,采用疾控中心認(rèn)可的住院趨勢五級分類:大幅下降、溫和下降、穩(wěn)定、溫和上升、大幅上升,讓決策者一眼可知風(fēng)險(xiǎn)等級。
3、“零樣本”應(yīng)對新變種,當(dāng) BQ.1 變種出現(xiàn)時(shí),無需重新訓(xùn)練模型,只需在提示詞中添加其特性描述:BQ.1 是奧密克戎亞型,對免疫逃逸能力增強(qiáng),預(yù)計(jì)兩周內(nèi)成為主流毒株。模型立即響應(yīng),預(yù)測準(zhǔn)確率提升 28.2%。
PandemicLLM 的疫情數(shù)據(jù)流和處理流程概述
人工智能與人類協(xié)作提示詞設(shè)計(jì)概要
實(shí)戰(zhàn)表現(xiàn):全美大考
在覆蓋全美 50 個(gè)州、長達(dá) 19 個(gè)月的測試中,PandemicLLM 的表現(xiàn):
1、精度碾壓傳統(tǒng)模型
1 周預(yù)測準(zhǔn)確率 56%(比最優(yōu)傳統(tǒng)模型高20%);
3 周預(yù)測準(zhǔn)確率 46.4%(誤差率降低22%);
模型規(guī)模越大表現(xiàn)越好:700 億參數(shù)版本準(zhǔn)確率達(dá) 57.1%。
2、置信度=可信度
當(dāng)模型對“大幅上升”的判斷置信度>85% 時(shí),實(shí)際發(fā)生概率高達(dá) 73%(1周)和 64%(3周)。
3、地域適應(yīng)性
在疫情趨勢一致的西部沿海、五大湖區(qū)表現(xiàn)最佳,而在政策多變的懷俄明州等地區(qū)仍有優(yōu)化空間,因此,團(tuán)隊(duì)建議開發(fā)區(qū)域定制模型。
總的來說,這項(xiàng)研究不僅破解了多模態(tài)數(shù)據(jù)融合的難題,更開創(chuàng)了 AI 輔助公共衛(wèi)生決策的新范式——下次疫情來襲時(shí),決策者或許不再面對冰冷數(shù)字,而是獲得一份“風(fēng)險(xiǎn)趨勢解讀報(bào)告”。
論文鏈接:
https://www.nature.com/articles/s43588-025-00798-6
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.