4月7日,斯坦福以人為本人工智能研究所(HAI)發(fā)布《2025年AI指數(shù)報告》,這份長達456頁的報告,全景展示了過去一年AI領(lǐng)域的關(guān)鍵進展。
以人為本人工智能研究所是斯坦福大學于2019 年成立的跨學科研究機構(gòu),由“AI教母”李飛飛聯(lián)合領(lǐng)導,其每年發(fā)布的“AI指數(shù)報告”成為全球人士了解人工智能前沿發(fā)展的核心文件。
具體來看,今年的報告共列了研究與開發(fā)、技術(shù)性能、負責任的AI、經(jīng)濟、科學與醫(yī)學、政策與治理、教育等8個章節(jié),其中科學與醫(yī)學占據(jù)43頁內(nèi)容。
在科學與醫(yī)學中,報告重點介紹了2024年醫(yī)學和生物學領(lǐng)域的AI里程碑,展示了AI在醫(yī)學影像、臨床試驗、輔助診斷等領(lǐng)域的進展,彰顯出AI在醫(yī)療保健的關(guān)鍵影響。
其中包括以下要點:
更大更好的蛋白質(zhì)測序模型出現(xiàn):2024年,包括ESM3和AlphaFold 3在內(nèi)的幾個大規(guī)模、高性能蛋白質(zhì)測序模型被推出。
AI繼續(xù)推動科學發(fā)現(xiàn)的快速進步:2022年和2023年標志著AI驅(qū)動科學的早期階段,2024年帶來了更大的進展。
領(lǐng)先AI模型的臨床知識持續(xù)提升:OpenAI最近發(fā)布的o1在MedQA基準測試中達到新的最先進水平96.0%——比2023年的最佳成績提高了5.8個百分點。
AI在關(guān)鍵臨床任務(wù)上超越了醫(yī)生:一項新研究發(fā)現(xiàn),僅GPT-4就能在診斷復雜臨床病例方面勝過醫(yī)生。其他研究顯示,AI在癌癥檢測和識別高死亡風險患者方面也超過了醫(yī)生。
FDA批準的AI醫(yī)療設(shè)備數(shù)量激增:FDA于1995年首次批準了人工智能驅(qū)動的醫(yī)療設(shè)備。到2015年,只有6種這樣的設(shè)備獲得批準,但到2023年,這一數(shù)字飆升至223種。
合成數(shù)據(jù)在醫(yī)學領(lǐng)域顯示出巨大的潛力:2024年發(fā)布的研究表明,人工智能生成的合成數(shù)據(jù)可以幫助模型更好地識別健康的社會決定因素,增強隱私保護的臨床風險預測,并促進新藥化合物的發(fā)現(xiàn)
醫(yī)學出現(xiàn)基礎(chǔ)模型:一批醫(yī)學大模型于2024年發(fā)布,從通用多模態(tài)模型Med-Gemini到垂類專業(yè)模型EchoCLIP(心電圖學)和ChexAgent(放射學)。
公開的蛋白質(zhì)數(shù)據(jù)庫規(guī)模不斷擴大:自2021年以來,主要公共蛋白質(zhì)科學數(shù)據(jù)庫的條目數(shù)量顯著增加,這對科學發(fā)現(xiàn)具有重要意義。
今年1月,李飛飛在接受采訪時稱,她對AI在醫(yī)療健康領(lǐng)域的應(yīng)用充滿熱情,“這是一個龐大的行業(yè),從基礎(chǔ)生物學研究,到臨床診斷、醫(yī)療服務(wù)和公共衛(wèi)生……令人振奮的是,在這個系統(tǒng)的每個環(huán)節(jié),AI都能發(fā)揮重要作用。”
對AI醫(yī)療的看好,已經(jīng)成為精英們的共識,此前木頭姐表示醫(yī)療保健將成為AI最為深遠的應(yīng)用領(lǐng)域,甲骨文CEO拉里·埃里森、OpenAI首席執(zhí)行官Sam Altman也以實際行動支持AI醫(yī)療發(fā)展。
得益于AI技術(shù)的發(fā)展,醫(yī)療健康領(lǐng)域正在經(jīng)歷一場深刻革命。
2024,AI醫(yī)療有哪些里程碑?
在“科學與醫(yī)學”章節(jié)的開頭,報告細數(shù)了過去一年AI在醫(yī)療和生物學領(lǐng)域的里程碑成果。
蛋白質(zhì)序列優(yōu)化:大語言模型來助力
盡管并非有意為之,但語言模型最近獲得了一項新的生物能力:優(yōu)化蛋白質(zhì)序列。
傳統(tǒng)上,蛋白質(zhì)工程需要大量的實驗室研究來改進序列以提高功能。然而,最近的一項研究發(fā)現(xiàn),未經(jīng)微調(diào)的語言模型在這一任務(wù)上變得異常有效。
研究人員采用定向進化的方法證明,語言模型能夠生成在合成和實驗適應(yīng)度景觀中均優(yōu)于傳統(tǒng)算法的蛋白質(zhì)序列。
Aviary:為生物學任務(wù)訓練Agent
FutureHouse是一家旨在實現(xiàn)科學發(fā)現(xiàn)過程自動化的公司,去年公司發(fā)布了Aviary,這是一個能夠執(zhí)行生物學研究中多步驟任務(wù)的代理,有望實現(xiàn)智力任務(wù)的自動化。
在Aviary框架下,AI Agent已經(jīng)可以執(zhí)行“操縱DNA 結(jié)構(gòu)進行分子克隆、通過查閱科學文獻來回答研究問題、構(gòu)建蛋白質(zhì)穩(wěn)定性”等具有挑戰(zhàn)性的科學任務(wù)。
結(jié)果顯示,Aviary的支持下,基于開源大語言模型構(gòu)建的智能體已經(jīng)可以在多個任務(wù)上比肩甚至超越人類專家,為科學探索的自動化進一步鋪平道路。
AlphaProteo:AI用于新型高親和力蛋白結(jié)合劑
AlphaProteo是谷歌DeepMind開發(fā)的模型,專注于創(chuàng)建能夠與特定目標分子結(jié)合的新型高親和力蛋白結(jié)合劑。
AlphaProteo設(shè)計了多個目標蛋白的首個結(jié)合劑,包括與癌癥和糖尿病相關(guān)的VEGF-A蛋白,在測試的七個目標蛋白上比現(xiàn)有任何方法的有效性高出300倍。
AlphaProteo的結(jié)合劑也比使用現(xiàn)有最先進設(shè)計方法創(chuàng)建的結(jié)合劑牢固約10倍,這是一項真正的生物工程突破,該模型正被用于藥物開發(fā)、診斷和生物技術(shù)應(yīng)用。
人腦圖譜:重建人類大腦的一小部分
谷歌的一個團隊在突觸水平上重建了人類大腦的一小部分——《連線》雜志稱贊這是“迄今為止最詳細的腦連接圖”。
該樣本取自一名癲癇患者手術(shù)中左側(cè)前顳葉,使用多束掃描電子顯微鏡成像。超過5000個薄約30納米的切片捕捉到了約57000個細胞——包括神經(jīng)元、膠質(zhì)細胞和血管——以及1.5億個突觸。
該項目標志著在理解神經(jīng)回路方面邁出了重要一步,并可能為未來的神經(jīng)治療提供參考。
虛擬AI實驗室:加強生物醫(yī)學研究
最近斯坦福大學引入了一個虛擬的人工智能實驗室,在這個實驗室中,多位“AI科學家”專注于不同的學科,并作為自主代理進行協(xié)作。
在實驗中,人類研究員委托這個AI實驗室設(shè)計能夠與導致病毒結(jié)合的納米抗體片段,該實驗室生成了92個納米抗體,其中超過90%在驗證研究中成功與病毒結(jié)合。
這項研究的真正意義不在于其具體發(fā)現(xiàn),而在于證明了一個完全自主的、由語言模型驅(qū)動的實驗室可以產(chǎn)生有意義的科學發(fā)現(xiàn)。
GluFormer:使用AI進行持續(xù)血糖監(jiān)測
GluFormer是由英偉達、魏茨曼研究所等機構(gòu)開發(fā)的基礎(chǔ)模型,基于近11000名個體的超過1000萬次血糖測量數(shù)據(jù)訓練而成,通過分析連續(xù)血糖監(jiān)測(CGM)數(shù)據(jù)來預測長期健康結(jié)果。
GluFormer可以在癥狀出現(xiàn)之前識別出有糖尿病風險或血糖控制惡化的個體。在一項為期12年、涉及580名成年人的研究中,它準確地標記了66%的新發(fā)糖尿病病例和69%的心血管相關(guān)死亡病例。
像GluFormer這樣的模型將使糖尿病護理從被動治療轉(zhuǎn)向主動預防,從而實現(xiàn)更早的臨床干預。
ESM3:模擬進化過程以生成新的蛋白質(zhì)
EvolutionaryScale的ESM3是一種開創(chuàng)性的模型,基于27.8億個蛋白質(zhì)序列進行了訓練,擁有980億個參數(shù),旨在通過模擬進化過程生成新型蛋白質(zhì)。
ESM3最顯著的成就之一是設(shè)計了esmGFP,這是一種新的人工綠色熒光蛋白,公司估計自然界需要5億年才能發(fā)展出這種蛋白。這是通過人類引導的思維鏈提示實現(xiàn)的。
ESM3還是開源的,促進了合成生物學和蛋白質(zhì)工程項目的合作,應(yīng)用于藥物發(fā)現(xiàn)、材料科學和環(huán)境工程。
AlphaFold3:預測所有生命分子的結(jié)構(gòu)和相互作用
谷歌DeepMind和Isomorphic Lab的最新成果——AlphaFold 3,不僅預測蛋白質(zhì)結(jié)構(gòu),還更精確地模擬其與關(guān)鍵生物分子(DNA、RNA、配體、抗體)的相互作用。
AlphaFold 3通過建模小分子與蛋白質(zhì)的相互作用,加速了藥物開發(fā),這對于疾病研究至關(guān)重要。此外,AlphaFold 3的開源賦予了全球科學家力量。
AI席卷醫(yī)療:從研發(fā)到臨床
蛋白質(zhì),是AI賦能生命科學的核心領(lǐng)域,過去一年,應(yīng)用于蛋白質(zhì)序列的AI模型取得了顯著進展。
一個明顯的趨勢是模型的訓練規(guī)模越來越大,這些由AI驅(qū)動的方法通過減少對昂貴且耗時的實驗方法的依賴,加速了蛋白質(zhì)功能和設(shè)計的探索。
這一過程中,各種公共蛋白質(zhì)科學數(shù)據(jù)庫中的條目數(shù)量也隨著時間的推移穩(wěn)步增長。這些數(shù)據(jù)庫成為研究者不可或缺的工具,然而保持數(shù)據(jù)質(zhì)量和防止模型偏差仍然是持續(xù)的挑戰(zhàn)。
目前,AI驅(qū)動的蛋白質(zhì)研究數(shù)量顯著增長,這些研究集中在功能預測(8.4%)、蛋白質(zhì)結(jié)構(gòu)預測(7.6%)和蛋白質(zhì)-藥物相互作用(3.0%)等幾個關(guān)鍵領(lǐng)域。
此外,圖像和多模態(tài)的人工智能也被用于科學發(fā)現(xiàn),冷凍電鏡、高通量熒光顯微鏡和全切片成像技術(shù)的進步,使科學家能夠以高精度檢查和分析原子、亞細胞環(huán)境及組織水平的結(jié)構(gòu),揭示復雜生物過程的新見解。
在藥物研發(fā)流程中,臨床試驗是最為耗時且花費最大的階段,近年來運用AI的臨床試驗數(shù)量正在穩(wěn)步上升。
去年,中國AI臨床試驗的數(shù)量達到105項,超過美國(97項)排名世界第一,緊隨其后的是意大利(42項)、土耳其(30項)、英國(24項)等。
臨床方面,AI在醫(yī)學影像領(lǐng)域的應(yīng)用正在迅速發(fā)展,擴展到新的數(shù)據(jù)模式,并解決日益復雜的臨床問題。
統(tǒng)計顯示,超過80%的FDA批準的機器學習軟件都針對醫(yī)學圖像的分析。近年來,醫(yī)學影像領(lǐng)域的大模型急劇增加,尤其是病理領(lǐng)域,基礎(chǔ)模型數(shù)量顯著增加。
然而,盡管該領(lǐng)域取得了一些成績,許多醫(yī)學影像中的AI仍然依賴于高度有限的訓練數(shù)據(jù)集,特別是在三維成像領(lǐng)域。
為了訓練更為穩(wěn)健的醫(yī)學影像AI模型,需要更大、更全面且多隊列的數(shù)據(jù)集,通過提升高質(zhì)量、標記好的訓練數(shù)據(jù)的可用性,預計模型性能會得到增強。
此外,在臨床實踐中,大語言模型的崛起為醫(yī)學決策、輔助診斷、患者護理、病歷管理等方面帶來變革。
一個具有代表性的情況便是AI在MedQA基準測試(其中包含超過60000個臨床問題)的表現(xiàn)已顯著提升。
微軟和OpenAI的研究團隊最近測試了o1,取得了新的最高分96.0%——比2023年創(chuàng)下的記錄提高了5.8個百分點。自2022年底以來,基準測試的表現(xiàn)提高了28.4個百分點。
行業(yè)對語言模型在醫(yī)療保健任務(wù)上的興趣激增,在PubMed中“大型語言模型”一詞的檢索結(jié)果為1566篇,僅2024年就發(fā)表了1210篇。
目前大語言模型已經(jīng)在臨床決策上展現(xiàn)出強大實力,一項涉及92名醫(yī)生的隨機對照試驗顯示,GPT-4獨立運行的決策水平與使用GPT-4進行輔助決策的人類醫(yī)生表現(xiàn)相當。
臨床文檔長期以來一直是醫(yī)生沉重負擔的來源,如今AI正在解決這一難題。
斯坦福大學的研究人員進行了一項完全集成的自動化AI速記系統(tǒng)測試,結(jié)果顯示醫(yī)生的采用率高達55%,AI速記使得每條記錄節(jié)省了約30秒的時間,醫(yī)生的負擔和倦怠分別平均減少了35%和26%。
這些發(fā)現(xiàn)表明,由AI驅(qū)動的速記技術(shù)可以顯著改善醫(yī)生的工作流程和福祉,既節(jié)省時間又減輕行政負擔。
報告進一步表示,AI融入電子健康記錄系統(tǒng)可以簡化臨床工作流程,提升醫(yī)護人員和患者的體驗并減輕醫(yī)療負擔。主要供應(yīng)商——Epic、Oracle Health、Meditech和TruBridge已廣泛采用AI。
近年來AI在醫(yī)療保健中的顯著影響,從FDA授權(quán)數(shù)量也能得到體現(xiàn)。
統(tǒng)計顯示,自2015年起,FDA每年批準的AI醫(yī)療器械數(shù)量呈現(xiàn)指數(shù)級增長,到2023年已達到223款。
—The End—
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.