近日,一家名為 FutureHouse 的非營利組織宣布推出一款名為 Robin 的新型人工智能(AI)工具,聲稱其能夠極大加速生物學(xué)等領(lǐng)域的科學(xué)研究進(jìn)程,該系統(tǒng)不僅能夠自主完成從假設(shè)提出、實驗設(shè)計到數(shù)據(jù)分析等關(guān)鍵科研環(huán)節(jié),更在實際應(yīng)用中,僅歷時約 2.5 個月便成功為干性年齡相關(guān)性黃斑變性(dAMD,dry age-related macular degeneration)這一復(fù)雜眼疾發(fā)現(xiàn)了一種新的潛在治療藥物。相關(guān)成果已通過預(yù)印本論文形式在arXiv平臺發(fā)布,并引起了科研領(lǐng)域和 AI 界的廣泛關(guān)注。
多個智能體構(gòu)成的全自動科研流程
這家由前谷歌 CEO Eric Schmidt 支持的組織創(chuàng)立于 2023 年,總部位于美國加州舊金山市。由首席執(zhí)行官 Sam Rodriques 和科學(xué)主管 Andrew White 聯(lián)合創(chuàng)立,其宏偉愿景是構(gòu)建能夠自主進(jìn)行科學(xué)研究的“AI 科學(xué)家”或 AI 系統(tǒng),從而加速疾病治療方法的發(fā)現(xiàn)、氣候變化解決方案的探索以及其他推動人類社會發(fā)展的技術(shù)創(chuàng)新。
圖丨FutureHouse 主要團(tuán)隊(來源:FutureHouse)
此前,F(xiàn)utureHouse 已經(jīng)推出了一系列專門用于自動化科學(xué)發(fā)現(xiàn)過程中特定環(huán)節(jié)的 AI 智能體(AI Agent),例如用于文獻(xiàn)搜索與綜合的 Crow、Falcon 和 Owl,用于化學(xué)合成設(shè)計的 Phoenix,以及用于復(fù)雜數(shù)據(jù)分析的 Finch。而近期推出的 Robin 系統(tǒng)的突破在于,它成功地將這些獨(dú)立的 AI 智能體(在此次發(fā)布的版本中,主要是 Crow、Falcon 和 Finch)整合到一個統(tǒng)一的工作流程中,實現(xiàn)了整個科學(xué)研究過程中關(guān)鍵智力步驟的自動化。
Robin 系統(tǒng)通過協(xié)調(diào)其內(nèi)部的 AI 智能體來工作,針對特定的人類疾病提出新的治療方法并進(jìn)行臨床前驗證。其核心運(yùn)作模式是一個包含假設(shè)生成、實驗設(shè)計和數(shù)據(jù)分析的迭代循環(huán)。科學(xué)家首先通過提供目標(biāo)疾病的名稱來引導(dǎo)系統(tǒng)。隨后,Robin 利用 Crow 和 Falcon 等文獻(xiàn)搜索智能體進(jìn)行廣泛的背景研究,并據(jù)此生成初步的科學(xué)假設(shè)。接著,系統(tǒng)會提出具體的實驗方案,包括選擇合適的體外檢測模型來驗證這些假設(shè)。
圖丨Robin 系統(tǒng)的架構(gòu)(來源:arXiv)
不過,盡管 Robin 能夠自主生成實驗大綱,并完成所有假設(shè)的提出、實驗方案的選擇、數(shù)據(jù)分析以及研究手稿中主要圖表的繪制,但具體的實驗還是需要由人類研究員承擔(dān)。
實驗完成后,研究人員將原始或半處理數(shù)據(jù)上傳至系統(tǒng),Robin 隨即便會部署像 Finch 這樣的數(shù)據(jù)分析智能體,對數(shù)據(jù)進(jìn)行自主分析與解讀。Finch 擅長處理如 RNA 測序和流式細(xì)胞術(shù)等復(fù)雜實驗所產(chǎn)生的數(shù)據(jù),它通過在 Jupyter notebook 中執(zhí)行分析代碼,提供可解釋且能夠復(fù)現(xiàn)的分析結(jié)果與可視化圖表。
為了有效應(yīng)對生物數(shù)據(jù)解釋本身固有的模糊性,以及語言智能體隨機(jī)性可能導(dǎo)致的分析結(jié)果差異,Robin 設(shè)計了可以啟動多個 Finch 分析軌跡的機(jī)制,讓每個軌跡獨(dú)立分析實驗數(shù)據(jù),最終通過元分析綜合所有輸出,從而形成基于共識的可靠結(jié)論。
根據(jù)這些分析結(jié)果,Robin 會從中提煉出具有實際應(yīng)用價值的科學(xué)見解,并將這些見解用于指導(dǎo)下一輪的治療假設(shè)生成,由此形成一個持續(xù)反饋和不斷優(yōu)化的閉環(huán)研究系統(tǒng)。這個迭代循環(huán)將持續(xù)進(jìn)行,直至研究人員最終篩選出令人滿意的新型候選藥物為止。
Robin 的首個發(fā)現(xiàn):為干性年齡相關(guān)性黃斑變性找到新療法
為了驗證 Robin 系統(tǒng)的實際能力,F(xiàn)utureHouse 將其應(yīng)用于尋找干性年齡相關(guān)性黃斑變性的潛在新療法。dAMD 是發(fā)達(dá)國家導(dǎo)致不可逆失明的主要原因,目前治療方案有限。僅在美國,就有約 150 萬人患有威脅視力的 dAMD,另有 60 萬人因此法定失明,且隨著人口老齡化,預(yù)計到 2050 年這一數(shù)字將增加近兩倍。
在針對 dAMD 的研究中,Robin 首先通過識別和審查 151 篇論文,提出了 10 種與 dAMD 相關(guān)的生物學(xué)機(jī)制進(jìn)行檢測。在對疾病機(jī)制和相應(yīng)實驗策略進(jìn)行排序后,Robin 提出通過增強(qiáng)視網(wǎng)膜色素上皮 (RPE) 細(xì)胞的吞噬作用來治療 dAMD,并建議在流式細(xì)胞術(shù)檢測中測試藥物提高 RPE 細(xì)胞吞噬能力的效用。
(來源:arXiv)
隨后,Robin 利用 Crow 對大約 400 篇關(guān)于 RPE 吞噬作用和 dAMD 治療前景的論文進(jìn)行了文獻(xiàn)綜述,并綜合結(jié)果提出了 30 種已有的候選藥物進(jìn)行實驗測試。Falcon 智能體則為這些分子制作了綜合評估報告,并通過一個由大語言模型評判的錦標(biāo)賽機(jī)制對它們進(jìn)行了排名。
研究團(tuán)隊選擇了排名前五的候選藥物進(jìn)行實驗測試,包括 Exendin-4、Fingolimod、MFGE8、Y-27632 以及 AICAR 和 TUDCA 的組合。實驗采用了 pHrodo 微珠,這種微珠在溶酶體的低 pH 環(huán)境中會被熒光激活,從而可以通過流式細(xì)胞術(shù)檢測單細(xì)胞的吞噬作用。
實驗數(shù)據(jù)顯示,ROCK 抑制劑 Y-27632 在細(xì)胞培養(yǎng)中顯著增強(qiáng)了 RPE 的吞噬作用。這一發(fā)現(xiàn)與臨床前模型的研究結(jié)果一致,即 Y-27632 可以恢復(fù) RPE 細(xì)胞的吞噬效率,證實了 Robin 基于文獻(xiàn)提出的候選方案的合理性。
為了更深入地探究其作用機(jī)制,Robin 接著提出進(jìn)行一項 RNA 測序?qū)嶒灒康氖谴_定 Y-27632 是否通過誘導(dǎo)特定的基因表達(dá)變化來增強(qiáng) RPE 細(xì)胞的吞噬功能。FutureHouse 的研究團(tuán)隊執(zhí)行了該實驗,隨后 Finch 智能體對獲取的 RNA 測序數(shù)據(jù)進(jìn)行了細(xì)致分析,結(jié)果發(fā)現(xiàn) Y-27632 能夠顯著上調(diào) ABCA1 基因的表達(dá)。
(來源:arXiv)
ABCA1 是 RPE 細(xì)胞中一種關(guān)鍵的脂質(zhì)外排泵,對于健康的 RPE 功能至關(guān)重要,它能促進(jìn)膽固醇和磷脂從質(zhì)膜主動轉(zhuǎn)運(yùn)到受體蛋白,然后再將其排出細(xì)胞。有趣的是,ABCA1 與先前已被確定為黃斑變性發(fā)病機(jī)制中治療靶點的 ABCA4 屬于同一轉(zhuǎn)運(yùn)蛋白家族。
此外,ABCA1 的脂質(zhì)受體——載脂蛋白 E (Apo-E),也已被確定為 dAMD 的潛在治療靶點。這些由 Robin 提出實驗、Finch 分析數(shù)據(jù)得出的機(jī)制性見解,不僅識別了有效的治療化合物,還揭示了疾病通路中原本可能未被探索的新分子靶點。
在對 Y-27632 進(jìn)行 RNA 測序分析的同時,Robin 還進(jìn)行了后續(xù)的候選藥物假設(shè)迭代。研究團(tuán)隊對其中 10 種藥物進(jìn)行了實驗測試,并將數(shù)據(jù)再次交由 Finch 分析。Finch 的分析結(jié)果顯示,利舒地爾 (ripasudil),一種在日本已獲批用于治療青光眼的 ROCK 抑制劑,其效果優(yōu)于 Y-27632,與 DMSO 對照組相比,可使 RPE 細(xì)胞的吞噬作用增加 7.5 倍。盡管需要進(jìn)一步在不同劑量和更長孵育時間下進(jìn)行測試以獲得最終比較,但利舒地爾相對于 Y-27632 的初步優(yōu)越表現(xiàn),證明了 Robin 通過迭代實驗和反饋逐步完善治療假設(shè)的能力。
AI For Science 也需要一個“星際之門”
Robin 系統(tǒng)的成功應(yīng)用,特別是在 dAMD 治療候選藥物的發(fā)現(xiàn)上,或?qū)⑹?AI 驅(qū)動科學(xué)發(fā)現(xiàn)的一個新范式。它首次將基于文獻(xiàn)的假設(shè)生成與實驗數(shù)據(jù)分析整合到一個持續(xù)的反饋系統(tǒng)中,實現(xiàn)了科學(xué)過程中關(guān)鍵智力步驟的自動化。
FutureHouse 認(rèn)為,盡管 Robin 最初應(yīng)用于藥物研發(fā)領(lǐng)域,但其內(nèi)置的 AI 智能體具有通用性,未來可應(yīng)用于從材料科學(xué)到氣候技術(shù)等多個不同領(lǐng)域的廣泛發(fā)現(xiàn)。
為了推動該領(lǐng)域的進(jìn)一步發(fā)展,FutureHouse 計劃在當(dāng)?shù)貢r間 5 月 27 日將 Robin 的代碼、數(shù)據(jù)和完整的智能體軌跡進(jìn)行開源發(fā)布,希望通過這種簡單工作流程編排智能體的方法能激勵其他研究者構(gòu)建自己的自動化發(fā)現(xiàn)系統(tǒng)。
然而,F(xiàn)utureHouse 的聯(lián)合創(chuàng)始人兼 CEO Sam Rodriques 在最近的采訪和此前的博客文章中也坦誠地指出了構(gòu)建真正“AI 科學(xué)家”所面臨的挑戰(zhàn)。他認(rèn)為,當(dāng)前的 AI 系統(tǒng),包括流行的聊天機(jī)器人如 ChatGPT 或 Claude,乃至此前走紅的 Sakana 的“AI 科學(xué)家”,雖然可以在文獻(xiàn)檢索和數(shù)據(jù)分析方面提供幫助,甚至生成一些初步的腳本和圖表,但這與真正的科學(xué)發(fā)現(xiàn)仍有距離。
圖丨相關(guān)博文(來源:Sam Rodriques)
Rodriques 強(qiáng)調(diào),科學(xué)研究是一個高度開放性的問題,需要 AI 具備在無限的假設(shè)空間和觀察空間中有效導(dǎo)航的能力,并能產(chǎn)生真正新穎的、甚至是顛覆性的概念,而不僅僅是增量式的想法。目前,AI 在假設(shè)生成方面仍存在主要差距,尤其是在產(chǎn)生具有“反向思維”的、未經(jīng)測試的新穎假設(shè)方面(甚至也有人質(zhì)疑 Robin 系統(tǒng)此次的發(fā)現(xiàn)也并不新穎)。為此,F(xiàn)utureHouse 計劃訓(xùn)練自己的“反向”推理模型,以期彌補(bǔ)這一不足。
(來源:X)
另一個關(guān)鍵挑戰(zhàn)在于 AI 與物理實驗的緊密結(jié)合。如何讓 AI 理解哪些實驗是可行的(構(gòu)建“可供性模型”),如何評估實驗結(jié)果的可靠性,識別潛在的偏見或混淆因素,并有效地利用這些多模態(tài)證據(jù)(如圖像、測序數(shù)據(jù)等)來更新其對世界的認(rèn)知,這些都是亟待解決的問題。
目前,實驗室機(jī)器人的靈巧性尚不足以完成許多精細(xì)的實驗操作,這成為了自動化科學(xué)研究的主要瓶頸之一。Rodriques 甚至呼吁政府支持一項類似“星際之門”的計劃,投入巨資(他提議至少 1000 億美元)來推動 AI 驅(qū)動的科學(xué)研究和實驗自動化。
此外,對 AI 科學(xué)家系統(tǒng)的準(zhǔn)確性和可靠性進(jìn)行穩(wěn)健且可擴(kuò)展的評估至關(guān)重要。FutureHouse 內(nèi)部已經(jīng)建立了擴(kuò)展人工評估的基礎(chǔ)設(shè)施,并創(chuàng)建了 LAB-Bench,一個針對多種科學(xué)任務(wù)的開放評估集。同時,他也指出,不能期望大型語言模型在零樣本情境下總能表現(xiàn)良好,需要創(chuàng)建能夠模擬科學(xué)研究核心環(huán)節(jié)并提供高質(zhì)量獎勵信號的環(huán)境,以便大規(guī)模訓(xùn)練 AI 科學(xué)家智能體。這可能還需要強(qiáng)化學(xué)習(xí)領(lǐng)域的基礎(chǔ)性突破,以適應(yīng)高度復(fù)雜和開放的環(huán)境。
就 Robin 系統(tǒng)本身而言,F(xiàn)utureHouse 也認(rèn)識到其仍有持續(xù)發(fā)展的空間。例如,雖然 Robin 能生成實驗大綱,但未來的迭代版本旨在提供更詳細(xì)、精確且可執(zhí)行的實驗方案,以最大限度地減少實驗室執(zhí)行所需的人工轉(zhuǎn)譯。
在數(shù)據(jù)分析方面,其核心智能體 Finch 目前在很大程度上仍需依賴領(lǐng)域?qū)<业木脑O(shè)計的提示工程來確保產(chǎn)生可靠且高質(zhì)量的分析結(jié)果;未來的發(fā)展方向是賦予 Finch 更強(qiáng)的自主性,使其能夠獨(dú)立生成分析提示,或至少能夠根據(jù)不同的數(shù)據(jù)模態(tài)智能調(diào)整現(xiàn)有提示,從而實現(xiàn)一個更為自主高效的科學(xué)發(fā)現(xiàn)流程。
最后,雖然 Robin 目前采用的是一種由大模型擔(dān)當(dāng)裁判的“錦標(biāo)賽”機(jī)制來篩選和提名治療相關(guān)的科學(xué)假設(shè),但 FutureHouse 認(rèn)為,未來的工作重點之一將是更好地將 AI 的假設(shè)生成和評估過程與人類頂尖科學(xué)家的專業(yè)判斷和直覺進(jìn)行深度對齊與融合,以期能夠更穩(wěn)定、更可靠地產(chǎn)生具有突破潛力的的高質(zhì)量科學(xué)假設(shè)。
參考資料:
1.https://arxiv.org/pdf/2505.13400
2.https://www.linkedin.com/company/futurehouse/
3.https://techcrunch.com/2025/05/06/futurehouse-previews-an-ai-tool-for-data-driven-biology-discovery/
4.https://www.theinformation.com/articles/startup-building-ai-scientist?rc=qjiy7u
5.https://www.sam-rodriques.com/post/what-does-it-take-to-build-an-ai-scientist
6.https://x.com/SGRodriques/status/1925024623948902801
排版:初嘉實
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.