編輯 | 蘿卜皮
生物醫(yī)學(xué)研究是我們進(jìn)行人類健康研究、疾病治療、藥物研發(fā)以及促進(jìn)臨床護(hù)理進(jìn)步的基石。
然而,隨著復(fù)雜的濕實(shí)驗(yàn)、龐雜的數(shù)據(jù)集、眾多分析工具以及海量文獻(xiàn)的增長,生物醫(yī)學(xué)研究日益受到重復(fù)性和碎片化工作流程的制約。這些工作流程使研究發(fā)現(xiàn)的速度嚴(yán)重變慢,且限制了創(chuàng)新的發(fā)生。
因此,我們亟需一種全新的方法來擴(kuò)展專業(yè)科學(xué)知識(shí)。
斯坦福大學(xué)( Stanford University)、基因泰克(genentech)、普林斯頓大學(xué)(Princeton University)等組成的聯(lián)合研究團(tuán)隊(duì)開發(fā)了 Biomni,這是一款通用的生物醫(yī)學(xué) AI 智能體(Agent),它可以自主執(zhí)行涵蓋各個(gè)生物醫(yī)學(xué)子領(lǐng)域的廣泛研究任務(wù)。
小編覺得它可能很靠譜!為什么這樣說呢?大家簡單看下它的工作邏輯就明白了。
為了系統(tǒng)地繪制生物醫(yī)學(xué)行動(dòng)空間,Biomni 首先使用一個(gè)行動(dòng)發(fā)現(xiàn)智能體來創(chuàng)建第一個(gè)統(tǒng)一的智能體環(huán)境——從 25 個(gè)生物醫(yī)學(xué)領(lǐng)域的數(shù)萬篇出版物中挖掘必要的工具、數(shù)據(jù)庫和協(xié)議。
在此基礎(chǔ)上,Biomni 具有通用智能體架構(gòu),將大型語言模型 (LLM) 推理與檢索增強(qiáng)規(guī)劃和基于代碼的執(zhí)行相結(jié)合,使其能夠動(dòng)態(tài)地組合和執(zhí)行復(fù)雜的生物醫(yī)學(xué)工作流程——完全不依賴預(yù)定義的模板或嚴(yán)苛死板的任務(wù)流。
系統(tǒng)基準(zhǔn)測試表明,Biomni 在異構(gòu)生物醫(yī)學(xué)任務(wù)(包括因果基因優(yōu)先級(jí)排序、藥物再利用、罕見疾病診斷、微生物組分析和分子克隆)中實(shí)現(xiàn)了強(qiáng)大的泛化,無需任何特定于任務(wù)的快速調(diào)整。
Biomni 擁有在真實(shí)案例中解讀復(fù)雜多模態(tài)生物醫(yī)學(xué)數(shù)據(jù)集并自主生成可實(shí)驗(yàn)測試方案的能力。它的出現(xiàn)使我們可以暢想,未來虛擬 AI 生物學(xué)家與人類科學(xué)家并肩作戰(zhàn),將顯著提升研究效率、臨床洞察力和醫(yī)療保健水平。
該研究以「Biomni: A General-Purpose Biomedical AI Agent」為題,于 2025 年 5 月 30 日發(fā)布在BioRxiv預(yù)印平臺(tái)。
論文鏈接:https://www.biorxiv.org/content/10.1101/2025.05.30.656746v1.full
Biomni 架構(gòu)
Biomni 由兩個(gè)主要組件組成:Biomni-E1(一個(gè)具有統(tǒng)一動(dòng)作空間的基礎(chǔ)生物醫(yī)學(xué)環(huán)境)和 Biomni-A1(旨在有效利用該環(huán)境的智能體)。
圖示:Biomni 中統(tǒng)一的生物醫(yī)學(xué)行動(dòng)空間和智能體環(huán)境概述。(來源:論文)
整理一個(gè)統(tǒng)一的生物醫(yī)學(xué)行動(dòng)空間極具挑戰(zhàn)性,因?yàn)樗旧砭头浅?fù)雜且內(nèi)容龐大。研究人員采用人工智能驅(qū)動(dòng)的方法系統(tǒng)地解決了這個(gè)問題。
具體來說,他們利用 bioRxiv 定義的 25 種學(xué)科類別,并在每個(gè)類別中選取 100 篇最新文章。行動(dòng)發(fā)現(xiàn) LLM 智能體按順序處理每篇論文,提取復(fù)制或生成所述研究所需的基本任務(wù)、工具、數(shù)據(jù)庫和軟件。這套全面的資源構(gòu)成了執(zhí)行大量生物學(xué)研究任務(wù)所需的基本行動(dòng)。
關(guān)于 Biomni-E1
隨后創(chuàng)建了 Biomni-E1,這是一個(gè)供生物醫(yī)學(xué) AI 智能體執(zhí)行各種操作的環(huán)境。已確定的工具均由人類專家進(jìn)行嚴(yán)格驗(yàn)證,并附有相應(yīng)的測試用例。這些工具因其重要性而被特意挑選出來,涵蓋復(fù)雜的代碼、特定領(lǐng)域的專業(yè)知識(shí)或?qū)iT的 AI 模型。
鑒于生物軟件本身所需的靈活性,其本身無法簡化為靜態(tài)函數(shù),研究人員構(gòu)建了一個(gè)預(yù)裝了 105 種常用生物軟件包的執(zhí)行環(huán)境,支持 Python、R 和 Bash 腳本。
為了方便數(shù)據(jù)庫集成,他們將資源分為兩類。
第一組由可通過 Web API 訪問的海量關(guān)系數(shù)據(jù)庫(例如 PDB、OpenTarget、ClinVar)組成。他們沒有創(chuàng)建多個(gè)單獨(dú)的檢索工具,而是為每個(gè)數(shù)據(jù)庫實(shí)現(xiàn)了一個(gè)統(tǒng)一的函數(shù)。每個(gè)函數(shù)接受自然語言查詢,并在內(nèi)部使用 LLM 解析數(shù)據(jù)庫模式并動(dòng)態(tài)生成可執(zhí)行查詢。
第二組是將不具備 Web 界面的數(shù)據(jù)庫下載到數(shù)據(jù)湖中,并在本地預(yù)處理為結(jié)構(gòu)化的 Pandas DataFrame,以便與智能體無縫集成。
該團(tuán)隊(duì)提出的 Biomni-E1 是首個(gè)生物醫(yī)學(xué) AI 智能體環(huán)境,含 150 個(gè)專用生物醫(yī)學(xué)工具、105 個(gè)軟件和 59 個(gè)數(shù)據(jù)庫。
關(guān)于 Biomni-A1
為了構(gòu)建一個(gè)能夠處理各種生物醫(yī)學(xué)任務(wù)的通用智能體,研究人員需要一個(gè)專門的智能體架構(gòu)——避免為每個(gè)任務(wù)編寫硬編碼的工作流程。這促成了 Biomni-A1 的開發(fā),它融合了多項(xiàng)對(duì)整個(gè)生物醫(yī)學(xué)研究領(lǐng)域至關(guān)重要的核心技術(shù)。
首先,研究人員引入了一種基于 LLM 的工具選擇機(jī)制,旨在應(yīng)對(duì)生物醫(yī)學(xué)工具的復(fù)雜性和專業(yè)性,并根據(jù)用戶目標(biāo)動(dòng)態(tài)檢索定制的資源子集。
其次,考慮到生物醫(yī)學(xué)任務(wù)通常需要豐富的程序邏輯,Biomni-A1 使用代碼作為通用操作接口,使其能夠編寫和執(zhí)行涉及循環(huán)、并行化和條件邏輯的復(fù)雜工作流。至關(guān)重要的是,這種方法還使智能體能夠交錯(cuò)調(diào)用不符合預(yù)定義函數(shù)簽名的軟件、工具、數(shù)據(jù)庫和原始數(shù)據(jù)操作,從而支持異構(gòu)資源的靈活和動(dòng)態(tài)集成。
第三,該智能體采用自適應(yīng)規(guī)劃策略:它基于生物醫(yī)學(xué)知識(shí)制定初始計(jì)劃,并在執(zhí)行過程中不斷迭代完善,從而實(shí)現(xiàn)響應(yīng)迅速、情境感知的行為。
這些技術(shù)共同使 Biomni-A1 能夠泛化到前所未有的任務(wù)和領(lǐng)域,動(dòng)態(tài)地組合智能動(dòng)作,并與軟件、數(shù)據(jù)和工具進(jìn)行交互,從而體現(xiàn)出通用生物醫(yī)學(xué)智能。
基準(zhǔn)測試
圖示:Biomni 在各種現(xiàn)實(shí)生物醫(yī)學(xué)任務(wù)中的零樣本泛化。(來源:論文)
基準(zhǔn)測試表明,Biomni 在現(xiàn)有的生物醫(yī)學(xué)問答基準(zhǔn)測試中表現(xiàn)出色,并在八個(gè)開發(fā)過程中從未遇到過的具有挑戰(zhàn)性的現(xiàn)實(shí)場景中表現(xiàn)出強(qiáng)大的泛化性能。
研究人員通過三個(gè)具有影響力的案例研究來強(qiáng)調(diào) Biomni 的實(shí)踐能力:
- 分析 458 個(gè)可穿戴傳感器數(shù)據(jù)文件從而產(chǎn)生新的見解;
- 對(duì)大量原始數(shù)據(jù)集(例如單細(xì)胞 RNA-seq 和 ATAC-seq 數(shù)據(jù))快速進(jìn)行全面的生物信息學(xué)分析,以產(chǎn)生新的見解和假設(shè);
- 自主設(shè)計(jì)實(shí)驗(yàn)室協(xié)議從而協(xié)助濕實(shí)驗(yàn)室研究人員完成任務(wù)。
圖示:Biomni 設(shè)計(jì)濕實(shí)驗(yàn)室實(shí)驗(yàn)方案。(來源:論文)
意義深遠(yuǎn)
Biomni 在遺傳學(xué)、基因組學(xué)、微生物學(xué)、免疫學(xué)、藥理學(xué)和臨床醫(yī)學(xué)等復(fù)雜任務(wù)中的零樣本性能,展現(xiàn)了其在提升科研效率、加速發(fā)現(xiàn)和拓展高級(jí)生物醫(yī)學(xué)分析應(yīng)用方面的潛力。
它通過將復(fù)雜且勞動(dòng)密集型的工作流程(通常需要專業(yè)知識(shí)和編程技能)自動(dòng)化,使研究人員能夠?qū)⒕D(zhuǎn)向創(chuàng)造性假設(shè)的生成、實(shí)驗(yàn)創(chuàng)新和跨學(xué)科合作。
圖示:Biomni 自主執(zhí)行復(fù)雜的多模式生物醫(yī)學(xué)分析并生成假設(shè)。(來源:論文)
這一轉(zhuǎn)變具有重要意義,比如:
- 在生物制藥的靶點(diǎn)和藥物研發(fā)領(lǐng)域,Biomni 可以自主確定靶點(diǎn)優(yōu)先級(jí)、設(shè)計(jì)干擾篩選或重新利用藥物,從而為更快速、更具成本效益的研究提供途徑。
- 在臨床應(yīng)用領(lǐng)域,其在基因優(yōu)先級(jí)排序和罕見病診斷方面的能力,有助于提供更精準(zhǔn)、個(gè)性化的洞察,并簡化診斷流程。
- 對(duì)于消費(fèi)者健康而言,Biomni 將可穿戴數(shù)據(jù)與多組學(xué)分析相結(jié)合,實(shí)現(xiàn)實(shí)時(shí)、個(gè)性化的健康監(jiān)測和干預(yù)。
局限性
同時(shí),研究人員也分析了 Biomni 的局限性。Biomni 的統(tǒng)一環(huán)境覆蓋了大量生物醫(yī)學(xué)工具和數(shù)據(jù)庫,但評(píng)估任務(wù)僅涉及該領(lǐng)域一小部分,且許多關(guān)鍵領(lǐng)域仍未探索。
雖然其在數(shù)據(jù)庫查詢、序列分析等任務(wù)上接近人類水平,但在需要深度臨床判斷或創(chuàng)新實(shí)驗(yàn)推理的任務(wù)中仍存在局限,尚未達(dá)到全領(lǐng)域?qū)<壹?jí)性能。
展望未來
盡管如此,這些局限性為未來的發(fā)展開辟了新的方向。利用強(qiáng)化學(xué)習(xí)訓(xùn)練生物醫(yī)學(xué)推理智能體,可以使其在規(guī)劃和執(zhí)行方面不斷自我提升。
整合多模態(tài)數(shù)據(jù)(文本、圖像和結(jié)構(gòu)化輸入)可以進(jìn)一步深化推理能力。讓 Biomni 能夠自主發(fā)現(xiàn)和整合新的工具和數(shù)據(jù)庫,并整合更多歷史方法(曾經(jīng)出現(xiàn)過的具有很高實(shí)用性的方法),將確保其適應(yīng)性和長期相關(guān)性。
展望未來,Biomni 及其后續(xù)產(chǎn)品有望成為人工智能驅(qū)動(dòng)的生物醫(yī)學(xué)生態(tài)系統(tǒng)的基礎(chǔ)設(shè)施,與人類專家無縫協(xié)作,解鎖關(guān)于健康和疾病的全新見解。
這種混合型合作關(guān)系或?qū)氐字厮苌镝t(yī)學(xué)研究——自動(dòng)化假設(shè)生成,擴(kuò)展發(fā)現(xiàn)流程,并使醫(yī)學(xué)創(chuàng)新以前所未有的速度和規(guī)模推進(jìn)。像 Biomni 這樣的通用藥物不僅可以加速突破,還能重新定義科學(xué)探究的未來。
Biomni 已經(jīng)上線,供大家免費(fèi)使用,快去體驗(yàn)一下吧。
Biomni:https://biomni.stanford.edu
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.