2024年諾貝爾物理學(xué)獎、化學(xué)獎相繼花落人工智能和人工智能生命科學(xué)領(lǐng)域,這一里程碑式的事件向世界宣告:我們正身處一場由AI引領(lǐng)的科學(xué)研究范式革命之中。
行至當下,生命科學(xué)的探索已全面邁入大模型時代:依托海量數(shù)據(jù)與龐大算力進行訓(xùn)練與優(yōu)化,大模型在精度、效率、可遷移性、涌現(xiàn)性等方面的優(yōu)勢盡顯,正以前所未有的方式推動著人類對生命系統(tǒng)復(fù)雜性的認知邊界。
大模型對科研實踐的革新遠不止于算法性能的提升,更在于其催生了新一代基礎(chǔ)設(shè)施與平臺體系,推動科學(xué)發(fā)現(xiàn)從單點模型突破轉(zhuǎn)向全流程智能閉環(huán),使得高復(fù)雜度、大體量的科研任務(wù)能夠?qū)崿F(xiàn)自主決策、動態(tài)優(yōu)化與持續(xù)進化。
作為全球生命科學(xué)大模型的先行者,百圖生科于2024年10月發(fā)布全模態(tài)生物大模型xTrimo V3,以2100億參數(shù)量刷新全球最大規(guī)模的生命科學(xué)AI基礎(chǔ)模型紀錄。以大模型為驅(qū)動,百圖生科構(gòu)建了覆蓋信息搜集-生物洞察-智能實驗的全流程AI生成式發(fā)現(xiàn)系統(tǒng),助力生命科學(xué)客戶和合作方實現(xiàn)研發(fā)效率提升、加速業(yè)務(wù)閉環(huán)。
據(jù)悉,百圖生科將于4月25日召開“智能進化 發(fā)現(xiàn)未來”生成式發(fā)現(xiàn)系統(tǒng)發(fā)布會,可以實現(xiàn)智能體智能調(diào)用自研核心工具和外部資源,用戶無需復(fù)雜操作,即可驅(qū)動“設(shè)計-構(gòu)建-測試-學(xué)習(xí)”的全流程,并通過知識與模型的共享共建,形成動態(tài)、開放、共贏的智能科創(chuàng)生態(tài),加速整個生命科學(xué)領(lǐng)域的突破。
近日,智藥局專訪了百圖生科首席科學(xué)家(AI大模型)李子青教授,作為享譽世界的AI學(xué)者,李教授指導(dǎo)和帶領(lǐng)公司多個大模型項目的研發(fā)與應(yīng)用,參與公司整體技術(shù)戰(zhàn)略的規(guī)劃和執(zhí)行。
本次訪談中,我們就AI for Life Science的前沿創(chuàng)新與應(yīng)用落地等話題進行了深度交流,站在AI深刻變革生命科學(xué)發(fā)現(xiàn)的歷史節(jié)點上,一個人、一家公司的探索軌跡和愿景使命被清晰地呈現(xiàn)出來。
百圖生科首席科學(xué)家(AI大模型)李子青教授
李子青(Stan Z. Li)教授是世界著名AI學(xué)者,IEEE Fellow、IPAR Fellow。他先后發(fā)表論文500余篇、引用76000余次,H-Index指數(shù)153,并在2024年世界科學(xué)家及大學(xué)排名(World Scientist and University Rankings)中, 位列“AI for Science”領(lǐng)域全球第一。他曾擔(dān)任包括人工智能頂級刊物《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE T-PAMI)副主編等重要學(xué)術(shù)職務(wù),長期活躍于國際頂級AI學(xué)術(shù)一線,享有全球?qū)W術(shù)界和產(chǎn)業(yè)界的廣泛聲譽。
李教授自1991年起在南洋理工大學(xué)任職至終身副教授,并于2000年加入微軟亞洲研究院擔(dān)任Lead Researcher,積累了豐富的學(xué)術(shù)研究和工業(yè)經(jīng)驗,發(fā)明了世界首個實時人臉識別系統(tǒng)。他2004年起擔(dān)任中國科學(xué)院模式識別國家重點實驗室資深研究員,主持了十余項國家重大專項研發(fā)。2019年起加入西湖大學(xué),擔(dān)任人工智能講席教授,主持西湖大學(xué)人工智能研究與創(chuàng)新實驗室的工作,并大力投入到AI+生命科學(xué)領(lǐng)域,取得了一系列突破性的學(xué)術(shù)成果。李教授作為項目負責(zé)人、首席科學(xué)家主持了國家“新一代人工智能”重大項目(AI+蛋白質(zhì)計算、藥物設(shè)計)兩項,自然基金委重點項目(AI+多組學(xué)分析)一項,成為AI+生命科學(xué)研究領(lǐng)域的前沿探索者。
Q:您從計算機視覺(如人臉識別)轉(zhuǎn)向AI+生命科學(xué)領(lǐng)域的契機是什么?兩個領(lǐng)域的核心方法論有哪些共通之處和差異性?
李子青:我之前一直做的是計算機視覺(Computer Vision),尤其是人臉識別技術(shù)研發(fā)。在微軟研究院工作期間,成功開發(fā)了全球首個實時人臉識別系統(tǒng)Eye-CU,比爾·蓋茨先生曾親自在CNN專訪中演示推薦。
中科院任職期間,帶領(lǐng)團隊將多模態(tài)人臉識別系統(tǒng)與智能視頻監(jiān)控方案應(yīng)用于多個國家級安防工程,包括2005年設(shè)計建設(shè)深圳羅湖-香港自動通關(guān)系統(tǒng),和2008北京奧運會及2010上海世博會的安防體系等先導(dǎo)創(chuàng)新性應(yīng)用。之后,隨著深度學(xué)習(xí)的成功應(yīng)用,國內(nèi)相關(guān)AI企業(yè)的蓬勃發(fā)展,使得人臉識別成為了一個成熟的產(chǎn)業(yè),我意識到,我在人臉識別領(lǐng)域的使命已經(jīng)完成。
2019年我加入西湖大學(xué)并擔(dān)任人臉識別講習(xí)教授。生命科學(xué)是西湖大學(xué)的優(yōu)勢學(xué)科,為我提供了轉(zhuǎn)型契機。通過與生命科學(xué)PI合作,開始涉足蛋白質(zhì)組學(xué)研究。盡管研究領(lǐng)域從人臉識別轉(zhuǎn)向生命科學(xué),但其底層方法仍然是數(shù)學(xué)、模式識別和機器學(xué)習(xí)。基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的特征空間映射模型,我們成功開發(fā)了高維數(shù)據(jù)空間到表征空間的深度流形變換,這項核心技術(shù)已應(yīng)用于癌癥早期診斷、蛋白質(zhì)建模、單細胞分析等多個前沿方向。
Q:針對AI for Life Science的研究,您目前主要精力放在哪些方向上?百圖生科“生命科學(xué)基礎(chǔ)大模型”與您的研究愿景有何契合?
李子青:過去5年,我?guī)ьI(lǐng)團隊從零開始,從蛋白質(zhì)組學(xué)應(yīng)用研究開始,逐步向蛋白質(zhì)結(jié)構(gòu)與功能設(shè)計延伸,繼而拓展至生物中心法則建模及靶標藥物開發(fā),從而構(gòu)建了一個從DNA,RNA、到蛋白質(zhì)和藥物設(shè)計一個比較完整的研究體系,這些屬于AI+分子生物學(xué)層面。這一從分子機理到應(yīng)用落地的研究路徑,與百圖生科的戰(zhàn)略方向高度契合。
接下來幾年,我會將研究拓展到AI+細胞生物學(xué)層面,利用AI和大數(shù)據(jù),構(gòu)建刻畫細胞運行機理、細胞分化和細胞命運調(diào)控的細胞基座大模型,賦能細胞機理研究及其在生命科學(xué)、健康醫(yī)療與合成生物學(xué)中的應(yīng)用。
百圖生科致力于AI生命科學(xué)大模型研究與產(chǎn)業(yè),也包括AI分子生物學(xué)和AI細胞生物學(xué)兩個層面,從模型研究到應(yīng)用落地,這個戰(zhàn)略方向與我的研究興趣高度契合。
在實施層面各有側(cè)重,我的實驗室聚焦前沿方法探索,百圖生科則著力于大模型方法的規(guī)模化、工程化驗證與產(chǎn)業(yè)化落地。
Q:AI for Life Science目前面臨的關(guān)鍵挑戰(zhàn)是什么?您和百圖將如何進一步解決這些問題?
李子青:AI與生命科學(xué)跨學(xué)科的深度融合,是實現(xiàn)突破的關(guān)鍵點之一。
以Alphafold 2的突破為例,其背后是DeepMind擁有一支跨學(xué)科的隊伍,包括分子動力學(xué)專家、生物學(xué)家、化學(xué)家、AI科學(xué)家與工程師等,這樣一個交叉團隊的密切合作與交流碰撞,才造就了Alphafold 2輝煌的成果,也啟動了AI for Science研究的新范式。
另一個例子是斯坦福大學(xué)、Arc Institute、英偉達等機構(gòu)合作的Evo 2。要開發(fā)有能力的生命科學(xué)大模型,就必須將AI與生命科學(xué)進行深入融合,將各個層級的生物內(nèi)在規(guī)律嵌入模型,而不是簡單地套用AI架構(gòu)。
另外一個關(guān)鍵是生物大數(shù)據(jù)的可得性,Alphafold背后就有PDB(Protein Data Bank)作為數(shù)據(jù)基礎(chǔ),當時包含20萬左右的蛋白質(zhì)結(jié)構(gòu)。如果沒有這樣蛋白質(zhì)序列和結(jié)構(gòu)的數(shù)據(jù),就不會有Alphafold。當前AI還無法很好解決生命科學(xué)的許多問題,一個重要的原因就是生物技術(shù)領(lǐng)域尚未開發(fā)出合適且充分的檢測技術(shù),以支撐有效的AI建模。
深入的學(xué)科交叉、充分的數(shù)據(jù),當然還有算力,是AI for Science取得突破的必要條件。
Q:蛋白質(zhì)領(lǐng)域,您和您團隊先后推出了PiFold、FoldToken系列等模型,均展現(xiàn)出相比同類模型更加高效的優(yōu)勢,這背后有什么秘訣?
李子青:我實驗室的小伙伴們是一個非常年輕且具有創(chuàng)造力的團隊,大都是計算機出身,也有數(shù)學(xué)和物理等基礎(chǔ)學(xué)科的人才,非常聰明能干,勇于進取。新進來的學(xué)生在學(xué)長指導(dǎo)下通過與刷SOTA積累基礎(chǔ)能力,然后在前沿領(lǐng)域開展具有范式革新意義的工作。
在PiFold中,我們對模型設(shè)計對各個層面進行了全面的分析,最終刪繁就簡推出了第一個非自回歸序列設(shè)計圖模型,取得了效率與精度取得雙重突破的模型;在FoldToken中,我們對向量量化的基礎(chǔ)方法也進行了詳細剖析和改進,提出了首個基于token化的蛋白質(zhì)序列-結(jié)構(gòu)建模方法。
我們認為,基礎(chǔ)方法的創(chuàng)新是最重要的,只有在基礎(chǔ)方法上取得突破,才能在各個領(lǐng)域都取得進展。我們也希望通過這些工作,推動蛋白質(zhì)領(lǐng)域的研究進展。
我作為實驗室的架構(gòu)師,會有意避免擁擠的賽道,而是去找更加新穎的、更加promising的方向去探索,這也契合西湖大學(xué)"高起點、小而精、研究型"的辦學(xué)特點。前沿成果可以通過百圖做scaling up,成為大模型的一部分。
Q:您之前提出“所有的生物分子都可以被token化”這個觀點,如何理解?與自然語言大模型相比,生命科學(xué)大模型的數(shù)據(jù)構(gòu)建、訓(xùn)練范式有何獨特性?百圖生科做了哪些努力?
李子青:生物數(shù)據(jù)中的序列(如蛋白質(zhì)序列)天然適合以token形式表征,而非序列數(shù)據(jù)(如蛋白質(zhì)結(jié)構(gòu)、圖像)可通過向量量化轉(zhuǎn)化為離散token。
這一過程背后的數(shù)學(xué)物理原理在于:相較于自然語言,生命科學(xué)數(shù)據(jù)是一種更高維度的數(shù)據(jù)。而連續(xù)空間(如n維向量)的表征存在大量信息冗余,而token化通過離散化壓縮信息,僅保留關(guān)鍵模式,這可能與物質(zhì)量子化的離散本質(zhì)一致,同時也能抑制數(shù)據(jù)中的噪聲。
另外一個原因是,將生物分子token化后,能夠適配目前應(yīng)用廣泛的Transformer這樣的通用架構(gòu),方便建模。當然,如前所述,其中需要巧妙利用數(shù)據(jù)的生物規(guī)律約束。
在過往的4年多的時間里,百圖生科致力于基于原始數(shù)據(jù)的數(shù)據(jù)圖譜構(gòu)建,針對生物語言和不同模態(tài)的算法創(chuàng)新,高通量實驗體系的建設(shè)以及大量的自產(chǎn)數(shù)據(jù)的積累,最終通過在藥物設(shè)計、靶點發(fā)現(xiàn)、生物制造等不同應(yīng)用場景進行驗證。
我和百圖生科最近在做一個事情,是將DNA、 RNA 和蛋白質(zhì)這些分子能夠通過中心法則原理深度地整合起來,嵌入到建模的過程中,我們相信這能夠提升大模型的質(zhì)量,并產(chǎn)生巨大的行業(yè)價值。
Q:在您看來,覆蓋蛋白質(zhì)、DNA、RNA等多模態(tài)的生物大模型未來將在哪些領(lǐng)域率先落地、切實改變我們的生活?
李子青:大語言模型的優(yōu)勢就在于能夠擴展多維度下游任務(wù)。在醫(yī)藥領(lǐng)域,xTrimo平臺在AI靶點發(fā)現(xiàn)、蛋白設(shè)計和生成、生命科學(xué)工具、疾病機理研究等應(yīng)用場景的200余個任務(wù)模型中達到了SOTA水平。已支撐客戶取得10余種已驗證抗體、10余個創(chuàng)新靶點授權(quán)等突破性成果,全球超400家用戶,在產(chǎn)業(yè)端產(chǎn)生顯著價值。
生物制造領(lǐng)域,xTrimo能夠為菌株改造、酶設(shè)計、工藝發(fā)酵等環(huán)節(jié)賦能。我們實際推進的產(chǎn)業(yè)化項目主要聚焦于工業(yè)應(yīng)用場景,涵蓋化工原料生產(chǎn)、飼料加工、環(huán)境保護等領(lǐng)域。從商業(yè)化路徑考量,初期突破點將優(yōu)先選擇高附加值的醫(yī)藥中間體和基礎(chǔ)化工原料領(lǐng)域,這類產(chǎn)品具備明確的市場需求和較高的技術(shù)可行性。
Q:您最近做了關(guān)于虛擬細胞的報告,這個也是諾貝爾化學(xué)獎得主德米斯·哈薩比斯口中“會徹底改變生物學(xué)研究”的技術(shù),這方面您和百圖做了哪些工作?
李子青:目前,我做AI細胞研究有兩個大的方向,一個是關(guān)于生命科學(xué),另一個是合成生物學(xué)。這兩個方面都具有重大社會意義。
我們正在構(gòu)建名為"5M"的多維研究框架,5M即5-Multi,包括多組學(xué)、多模態(tài)、多擾動、多尺度、多任務(wù),旨在“5M”數(shù)據(jù)基礎(chǔ)上,構(gòu)建細胞狀態(tài)和隨時間空間變化的模型。我前面說過,AI生命科學(xué)發(fā)展有賴于生物化學(xué)檢測技術(shù)的突破,特別是測序技術(shù)與成像技術(shù)的協(xié)同發(fā)展。AI虛擬細胞任重道遠。
相較于生命科學(xué),合成生物學(xué)更容易落地。我跟百圖生科聚焦于合成生物的產(chǎn)業(yè)端,希望能夠解析單細胞微生物原理,并應(yīng)用于生物制造,包括如何設(shè)計改造和優(yōu)化微生物賦能生物制造,如何將工藝進行優(yōu)化,從而大幅度提升細胞產(chǎn)出效率。
Q:前不久百圖生科宣布開源全球首個千億參數(shù)蛋白質(zhì)大模型xTrimoPGLM,您覺得這對行業(yè)發(fā)展有怎樣推動作用?
李子青:我們希望通過開源xTrimoPGLM,推動整個AI+生命科學(xué)領(lǐng)域的發(fā)展。目前,xTrimoPGLM實現(xiàn)了對蛋白質(zhì)結(jié)構(gòu)預(yù)測、功能分析和序列生成等任務(wù)的全方位處理能力,在抗體序列生成和復(fù)合物結(jié)構(gòu)預(yù)測領(lǐng)域已達到國際領(lǐng)先水平,2025年4月,xTrimoPGLM也登上頂級期刊《Nature Methods》。
其次是降低了行業(yè)門檻,加速創(chuàng)新轉(zhuǎn)化。模型開源后,研究人員可直接針對酶穩(wěn)定性預(yù)測、親和力分析等垂直任務(wù)進行微調(diào),大幅降低從零訓(xùn)練大模型所需的數(shù)據(jù)與算力成本,這為中小型企業(yè)提供了低門檻研發(fā)路徑。我們還希望通過開放生態(tài)推動行業(yè)標準化。以Model Hub為例,該平臺已集成數(shù)十個垂類模型,未來有望吸引更多行業(yè)貢獻者共建開放生態(tài)。
簡單而言,此次開源不僅提供全球領(lǐng)先的蛋白質(zhì)AI工具,更通過平臺化建設(shè)重構(gòu)研發(fā)生態(tài),推動生命科學(xué)從單點突破轉(zhuǎn)向系統(tǒng)性創(chuàng)新,預(yù)計將為行業(yè)帶來研發(fā)效率的指數(shù)級提升與成本結(jié)構(gòu)的根本性優(yōu)化。
Q:AI領(lǐng)域,Agent(智能體)近來成為熱門話題,行業(yè)也將2025定位為“智能體元年”,您和百圖生科在這方面做了不少工作,可以分享下相關(guān)進展嗎?
李子青:AI Agent技術(shù)正以顛覆性姿態(tài)重塑全球產(chǎn)業(yè)格局。百圖生科在四月底即將發(fā)布生成式發(fā)現(xiàn)系統(tǒng),通過多智能體系統(tǒng)重構(gòu)技術(shù)底層。基于2100億參數(shù)的xTrimo多模態(tài)大模型,智能體能夠自主調(diào)用自研核心工具及外部資源,實現(xiàn)超越傳統(tǒng)自動化的“深度研究”能力。
這一技術(shù)突破使AI從單一執(zhí)行工具升級為具備主動推理能力的“智能研究伙伴”,在靶點發(fā)現(xiàn)、分子生成等環(huán)節(jié)中完成復(fù)雜任務(wù)協(xié)同,標志著生命科學(xué)領(lǐng)域AI應(yīng)用從輔助工具向研究主體的范式躍遷。
在交互場景創(chuàng)新方面,百圖生科以自然語言對話重構(gòu)科研工作流。通過構(gòu)建“對話即研究”的智能體交互界面,科研人員無需掌握專業(yè)編程技能即可驅(qū)動涵蓋設(shè)計、構(gòu)建、測試、學(xué)習(xí)的全流程實驗閉環(huán)。這種低門檻的人機協(xié)同模式將研究者從重復(fù)性工作中解放,使其更聚焦于科學(xué)假設(shè)與創(chuàng)新突破,重塑了生命科學(xué)研發(fā)的人機協(xié)作生態(tài)。
生態(tài)構(gòu)建層面,企業(yè)著力打造開放的智能體網(wǎng)絡(luò)生態(tài)。通過共享模型、數(shù)據(jù)與知識庫,連接產(chǎn)學(xué)研多方資源形成動態(tài)協(xié)作網(wǎng)絡(luò)。這種開放架構(gòu)不僅加速了技術(shù)迭代與知識沉淀,更通過智能體間的協(xié)同計算能力,為藥物研發(fā)、合成生物等細分領(lǐng)域創(chuàng)造規(guī)模化價值,推動整個生命科學(xué)產(chǎn)業(yè)向智能化、平臺化方向演進。
Q:國內(nèi)外的一些研究顯示,生成式AI可以有效幫助加速科學(xué)發(fā)現(xiàn)的進程,”AI科學(xué)家“這個概念應(yīng)運而生,對此您怎么看?AI對科學(xué)發(fā)現(xiàn)的變革將以何種方式實現(xiàn)?
李子青:生成式AI正推動科研范式革命,“AI科學(xué)家”通過整合文獻分析、假設(shè)生成、實驗設(shè)計、數(shù)據(jù)驗證及論文撰寫等全流程能力,將科學(xué)探索的效率提升至前所未有的高度,同時也引發(fā)學(xué)界對技術(shù)潛力與倫理風(fēng)險的深度思考。
當前“AI科學(xué)家”仍面臨多重瓶頸:其一,多模態(tài)能力不足,尤其在視覺信息處理和實驗操作環(huán)節(jié)依賴人工干預(yù);其二,邏輯推理能力有限,例如大語言模型常出現(xiàn)數(shù)字比較錯誤;其三,評估體系尚未成熟,AI生成結(jié)論的可解釋性與透明度亟待提升。倫理風(fēng)險亦不容忽視——自動化論文生產(chǎn)可能加劇學(xué)術(shù)泡沫,而生物安全等領(lǐng)域的技術(shù)濫用更需全球監(jiān)管協(xié)作。
Cell一篇名為“Empowering biomedical discovery with AI agents”的文章深入探討了AI agents如何加速生物醫(yī)學(xué)研究的突破,及其在與研究人員協(xié)同合作中發(fā)揮的關(guān)鍵作用。文章指出AI agents的發(fā)展體現(xiàn)為四個層次:
第一層——AI僅作為工具使用,例如AlphaFold用于預(yù)測蛋白質(zhì)的三維結(jié)構(gòu);
第二層——AI agents在研究人員的指導(dǎo)下完成特定任務(wù),如在基因組關(guān)聯(lián)研究(GWAS)中執(zhí)行生物信息學(xué)分析;
第三層——AI agents作為研究人員的“合作伙伴”出現(xiàn),能夠參與假設(shè)生成與實驗規(guī)劃。例如,AI agents可以基于現(xiàn)有基因數(shù)據(jù)自動提出某些基因與特定疾病相關(guān)的假設(shè),并設(shè)計實驗驗證這些假設(shè)。這時的AI agents不僅執(zhí)行研究人員的指令,還可對實驗方案提出改進建議,基于實驗結(jié)果不斷調(diào)整研究方向,成為科學(xué)研究的重要合作伙伴;
第四層——AI agents被設(shè)想為具有獨立科學(xué)發(fā)現(xiàn)能力的“AI科學(xué)家”,能夠基于現(xiàn)有知識自主提出新的科學(xué)假設(shè)并獨立完成實驗驗證。這類AI agents不僅是工具或助手,更是可以與研究人員并肩作戰(zhàn)的研究伙伴。這時的AI agents需具備高度的學(xué)習(xí)與推理能力,能夠在面對復(fù)雜性和不確定性時做出合理判斷。
學(xué)界普遍認為,AI將推動科研進入“第五范式”。AI不僅加速數(shù)據(jù)處理,更通過知識圖譜構(gòu)建與跨學(xué)科關(guān)聯(lián),催生全新科學(xué)假設(shè)。開放科學(xué)資源將成為創(chuàng)新關(guān)鍵,而人類科學(xué)家的核心角色將轉(zhuǎn)向戰(zhàn)略規(guī)劃與創(chuàng)造力激發(fā)。
在這場人機協(xié)作的科研革命中,“AI科學(xué)家”既是工具也是伙伴。它雖無法替代人類的直覺與靈感,卻能通過超強算力與模式識別,將科學(xué)家從重復(fù)勞動中解放,聚焦于更本質(zhì)的探索。隨著多模態(tài)模型與系統(tǒng)的進化,一個更自主、更富創(chuàng)造力的科學(xué)發(fā)現(xiàn)新時代正在加速到來。
Q:目前百圖生科在生命科學(xué)大模型的研發(fā)和投入主要在哪些方面?未來1-3年的大模型迭代的愿景是什么?
李子青:作為生命科學(xué)AI大模型的先行者,百圖生科近年來持續(xù)深化生命科學(xué)大模型技術(shù)的布局和創(chuàng)新。在技術(shù)底層,百圖生科構(gòu)建了全球首個覆蓋蛋白質(zhì)、DNA、RNA、細胞、小分子等七個模態(tài)的生命科學(xué)大模型xTrimo V3。
未來三年,百圖生科計劃將模型參數(shù)進一步擴展,并新增代謝組學(xué)、微生物組等模態(tài),實現(xiàn)從分子到生態(tài)系統(tǒng)的全鏈條建模。我們正在研發(fā)的跨尺度建模技術(shù),例如結(jié)合細胞互作模型與臨床數(shù)據(jù)預(yù)測藥物副作用,或?qū)⒅匦露x藥物研發(fā)范式。
應(yīng)用場景將向合成生物學(xué)、細胞基因治療等領(lǐng)域縱深拓展。公司正在開發(fā)基于單細胞轉(zhuǎn)錄組基礎(chǔ)模型scFoundation的“細胞級生命模擬器”,前期成果已入選“2024年度中國生物信息學(xué)十大進展”。在生物制造領(lǐng)域,計劃通過AI優(yōu)化工業(yè)菌株改造、提高中試發(fā)酵工藝效率。
此外,公司還將繼續(xù)執(zhí)行開源戰(zhàn)略。繼開源xTrimoPGLM后,公司計劃釋放更大規(guī)模模型能力,使中小型機構(gòu)也能低成本使用千億級AI工具。同時加速全球開發(fā)者社區(qū)建設(shè),我們希望成為生物計算基礎(chǔ)設(shè)施的核心提供者。
百圖正以“基礎(chǔ)大模型+垂直場景+開放生態(tài)”的三維戰(zhàn)略,努力引領(lǐng)中國在全球生物計算競爭中占據(jù)制高點。
注:
本次訪談內(nèi)容已經(jīng)過編輯整理并已獲得受訪者認可,我們也歡迎讀者通過留言互動,分享您對本訪談的看法。欲了解更多關(guān)于百圖生科生成式發(fā)現(xiàn)系統(tǒng)的信息,敬請關(guān)注本月
25日的發(fā)布會,屆時智藥局也將進行直播。
—The End—
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.