導語
2025年6月初,斯坦福大學黃柯鑫、Serena Zhang、王瀚宸、屈元昊、陸熒洲等研究人員聯合Genentech、Arc Institute、加州大學舊金山分校及普林斯頓大學等機構,發布了通用生物醫學AI智能體——Biomni。該智能體能夠自主完成遺傳學、基因組學、微生物學、藥理學和臨床醫學等多領域的復雜研究任務,實現了AI在生物醫學研究中從"輔助工具"向"自主研究者"的轉變。Biomni通過整合分散的科研資源,有效解決了傳統研究流程的碎片化問題,為跨學科、高通量的自主化科學發現提供了新的可能性。
郭瑞東丨作者
作為一名生命科學研究者,你是否時常因處理不完的實驗數據感到煩惱?作為一個接受了基因檢測的普通人,你該如何看懂基因檢測報告,知道基因變異帶來的影響?大模型的出現讓你覺得可以咨詢大模型,但又擔心幻覺,如今斯坦福大學團隊發布的生物醫學領域的通用智能體Biomni,不僅能夠幫助生物學研究者和相關領域的學生節省時間,提高科研效率,還能讓生物醫學領域的最新成果,更方便的進入普通人的生活。
Biomini系統地址:https://app.biomni.stanford.edu/
Biomni和通用智能體有何不同
Deepseek等通用大模型,相比Biomni可以算是一個通才,而Biomni則是一個針對生物醫學領域的智能體。它之所以厲害,是由于它包含了從基因編輯到蛋白質結構預測的150個專業工具,59個核心數據庫(如PDB蛋白質結構、ClinVar臨床變異等),這就相當于Biomni在完成通識教育后,又根據生物醫學領域,進行了專業培訓。
圖1a)Biomni根據biorxiv上定義的25個生物醫學相關子學科,經過專家審核定下的數據庫和軟件工具,同時該智能體的運行環境中,還包括了105個預裝的生物醫學領域的軟件工具包,以及從分子克隆到顯微鏡操作的標準化實驗流程。b)包含基因組,微生物,生化,病理,生物物理,分子生物學,藥物等多個領域,c)Biomni的工作方式,包括搜索,推理,列出觀察,執行代碼并匯總等步驟
與傳統大模型不同,Biomni不是輸出一段文本,而是能像人類研究員一樣動態生成Python/R代碼來組合各種工具。Biomni的具體工作流程如下
使用網絡搜索系統,識別最相關的工具、數據庫和軟件;
使用大模型的推理和規劃將模糊的研究問題拆解為可執行步驟,制定出完成任務每一步的詳細計劃;
在執行階段,每一步通過可執行代碼表達,從而實現精確和靈活的操作;
在報告階段,自動生成包含圖表和討論的“論文級”報告
由于是執行代碼,Biomni的運行是動態調整,逐步迭代的,并能夠展示出解答問題的全過程,避免幻覺的出現,這是其取決于之前的大模型工具的革命性之所在。
具體的表現如何,我們先來看論文中展示的幾個案例,之后再討論筆者實測的Biomni的幾個例子。
Biomni的應用案例
第一個例子,是分析來自可穿戴設備記錄的血糖檢測數據,假設你拿到來自30人的連續血糖和體溫監測數據,以及吃飯的時間點的幾百份原始excel數據。只需要直接丟給Biomni,Biomni自動完成了數據清洗,之后探索數據中的規律發現了人類可能忽略的模式:餐后體溫平均上升2.19°C,個體之間差異存在差異。最終數據分析的結果,以圖2c的圖表形式展示出來。而這一切的過程,都有著可復現的代碼,這相當于一個完全體的數據分析師任你差遣。
圖2 Biomni分析血糖數據
第二個例子,是讓biomni進行生物領域更復雜的數據分析,丟給Biomni一組骨骼發育的單細胞轉錄組snRNA加單核ATAC數據,Biomni用5小時完成了人類需要數周的分析:它不僅能重現了已知的骨骼發育調控網絡(如RUNX2基因的作用),還發現了三個從未被報道的“幕后導演”——AUTS2、ZFHX3和PBX1轉錄因子在軟骨細胞和成骨細胞中異常活躍(圖3h)。這就是傳統的大模型,甚至是像Manus這樣的智能體都無法完成的工作,因為這些智能體無法調用分析專業數據所需的python包,而針對生物醫學開發的通用智能體,可以直接運行相關的數據分析代碼,這體現了Biomni相比之前工具革命性的優勢。
圖3 Biomni 分析多組學基因測序數據
第三個例子更加具有挑戰性,Biomni被要求針對一段給定的堿基序列,設計的CRISPR敲除方案,流程如圖4所示,Biomni設計的方案通過了專家盲審,更在真實實驗中一次成功——設計的引物100%準確,克隆效率超越人類實習生,與一位擁有五年相關領域經驗的斯坦福博士后的水平相當。這打破了“AI只會紙上談兵”的刻板印象。
圖4 Biomni 設計CRISPR敲除方案
Biomni親身體驗展示
除了論文中提到的幾個例子,筆者也親身體驗了Biomni,接下來展示幾個案例。
首先是對基因測序的結果進行解讀。無論是遺傳病還是癌癥的靶向藥檢測,基因檢測已經越來越大眾熟悉。但普通人面對檢測結果,卻缺少解讀能力,如果詢問大模型,會擔心其出現幻覺。而Biomni可以在拿到基因檢測結果后,給出個人用藥和可能的遺傳病風險信息,根據證據等級和嚴重程度,匯總成markdown形式的報告展示。除了對基因變異的解讀,Biomni還會給出臨床管理建議,替代藥物選擇及進一步的檢測項目建議。有了Biomni,普通人也可以獲得專業的基因檢測結果解讀了,這相當于替代了專業的遺傳咨詢師的工作。
對于生物醫學領域的學生,閱讀文獻是必不可少的,而Biomni不止能像傳統的大模型那樣幫你總結文獻。丟給Biomni一篇使用空間組學研究乳腺癌的論文,Biomni會將論文拆解為幾部分,分別通過代碼輸入了新編寫的程序,在通過執行程序得到對文中每一部分對總結,之后模型會執行代碼,規劃下一步要進行的動作,最終生成的總結,能夠確保忠實于原文。更超預期的是,Biomni雖然由于無法處理圖片,沒有像素級的復現出論文中研究圖表對應的可視化展示,但其根據論文中的描述,生成的代碼及其繪制的圖,的確包含了研究圖表中對應的發現,如圖6所示。這無疑方便了相關領域的學生復現關鍵論文,通過運行大模型生成的代碼,切身體驗論文對應的研究過程,從而加深理解。
在接下來的提問中,筆者還嘗試讓Biomni根據給出的文獻,設計類似項目的實驗計劃,并推薦該領域的相關文獻,Biomni在總結了對應論文實驗設計上的關鍵點,并進行了谷歌搜索后,Biomni給出了如果我想照葫蘆畫瓢,用類似的方法研究前列腺癌,需要做什么樣的實驗,多么大的樣本量,需要關注那些生物標志物,如何對發現進行驗證等信息,并通過甘特圖給出了項目每一階段的預期目標。不止如此,Biomni還給出了空間轉錄組實驗設計最佳實踐指南這樣一份具有一般性的指導文件,這就遠遠超過了一般通用大模型工具,不僅會搜索,還會生成繪制類似可視化圖所需的代碼,可借鑒的實驗設計等,這無疑將方便相關領域研究者的學習與實踐。
圖6 Biomni根據論文描述,編寫代碼,運行后繪制的圖
Biomni論文中給出了一個讓Biomni進行分子生物學專業數據分析的例子,而筆者則試了試論文中沒有提及的一類數據分析任務,即通過全基因組關聯分析的結果,使用孟德爾隨機化找到具有因果關系的環境暴露因素。這里選取了來自GWAS catelog中關于帕金森的一項研究,將未經人工清洗的數據丟給Biomni,也沒有給出明確的實驗方案。Biomni自主完成了數據清洗,并按照孟德爾隨機的標準方案進行了數據分析,其中的每一步都清晰可見,分析結果的可視化,也和主流論文中的圖表類似,如圖7所示,雖然筆者給出的數據沒有得到具有顯著臨床意義的數據,但這也展示了Biomni進行完整生物醫學實驗的能力。這說明了Biomni的通用性,能夠具有在廣泛的生物醫學相關數據分析任務泛化。
圖7 Biomni根據提供的數據,進行孟德爾隨機發分析后,得到的結果可視化
除了學術界,Biomni也可以幫助產業界規劃科研轉換,例如讓Biomni涉及一整套能夠減少肺癌發病率的早篩方案。Biomni先搜索了相關方案,給出了結合基因組,轉錄組,蛋白組和代謝組的整合方案。之后還給出了檢測報告生成的代碼架構,報告模版和可視化展示,并對方案對臨床價值進行了評估,而這一切都只花了十幾分鐘就能完成。
未來展望
盡管表現驚艷,論文作者對Biomni保持了清醒認知,指出Biomni當前偏重分子生物學和基因組學,對神經科學、生態學等領域覆蓋不足,在需要顛覆性思維的原創研究(如全新實驗方法設計)上仍落后人類,同時Biomni的設計導致其過于依賴最新文獻,可能忽略早期重要但“過時”的方法。
未來的方向,可以整合顯微鏡圖像、實驗視頻等非文本數據,訓練多模態模型,并通過構建世界模型,讓智能體得以通過強化學習從實驗失敗中自主改進,更進一步的目標是開發“AI-人類”混合工作流,而非完全替代人類研究者。
Biomni的出現,代表的不僅是技術突破,更可能引發科研范式的根本變革。試想:博士生可以從繁瑣的數據分析中解放,專注創造性思考。偏遠地區醫院也能獲得頂級基因診斷能力,讓醫療資源更加平等,而科研的泛式從“假設→實驗→發表”的線性流程變為并行探索網絡,這些變化正如AlphaFold顛覆結構生物學,Biomni或許正開啟一個“AI-人類共生”的新科研時代。它提醒我們:科學的未來不是機器取代人類,而是懂得使用AI的科學家取代不懂使用的同行。在這個意義上,每個研究者都面臨選擇——是成為AI的導師,還是淪為它的助手?
AI驅動的計算醫學前沿研討會
生命科學與醫學領域正經歷著深刻的智能革命。大語言模型與多智能體技術快速發展,正在推動形成計算醫學(Computational Medicine)新范式,為精準醫療、疾病診斷和健康管理開辟全新路徑。AI驅動的計算醫學在自主探索、跨尺度數據融合、個體建模與數字孿生等方面快速發展,然而跨學科合作與方法論整合仍是重要挑戰。
為此,DAMO開發者矩陣(由阿里巴巴達摩院和中國互聯網協會聯合發起)與集智俱樂部共同主辦,邀請多位國內外前沿學者與業界專家分享交流。系列研討會將系統梳理計算醫學與AI交叉領域的最新進展,自2025年7月6日(周日)開始,共5大議題分享與討論。歡迎相關研究、應用領域的朋友報名參加,共同推動生命科學與醫療健康的智能未來!
本活動免費報名,實行審核入群制,請填寫信息后入群參與交流并獲得每期活動信息。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.