百圖生科技術(shù)副總裁張曉明(圖片來源:受訪者提供)
新藥研發(fā)是人類發(fā)展中極具風險和復(fù)雜度、耗時最漫長的技術(shù)研究領(lǐng)域之ー。
今年1月,英國《自然》雜志子刊《自然醫(yī)學》(Nature Medicine)發(fā)表的一篇論文顯示,平均而言,新藥的研發(fā)投入約26億美元,可能需要耗時12-15年,但不幸的是,即使在臨床試驗階段,新藥的成功率也低于10%。
上述論文認為,新藥研發(fā)復(fù)雜的原因在于,傳統(tǒng)藥物研發(fā)依賴于藥物開發(fā)人員的經(jīng)驗和反復(fù)試驗,尤其尋找潛在候選藥物需要探索的化學空間之大,而且監(jiān)管要求非常嚴格,滿足安全性、有效性和質(zhì)量標準可能是一項耗時且成本高昂的工作。因此,為了克服這些挑戰(zhàn),科學家們一直在積極探索新技術(shù)和新方法,以改進藥物開發(fā)流程。
如今,AI 技術(shù)的出現(xiàn),尤其是大模型在內(nèi)的生成式AI技術(shù),融入藥物開發(fā)流程——靶點識別、藥物發(fā)現(xiàn)、臨床研究等,有望重塑傳統(tǒng)藥物研發(fā)模式,從而有效提升藥物研發(fā)效率。
最新數(shù)據(jù)顯示,目前全球已經(jīng)有3800家企業(yè)、4900家投資機構(gòu)入局AI生物領(lǐng)域,相比四年前筆者發(fā)表的《AI何以成“藥神”》深度文章中提到入局的300家企業(yè)、880家投資機構(gòu),分別增長了1166.7%、456.8%,增長趨勢十分明顯。據(jù)麥肯錫全球研究院預(yù)測,生成式AI技術(shù)將為制藥和醫(yī)療技術(shù)公司每年創(chuàng)造600億-1100億美元的經(jīng)濟價值。
百圖生科技術(shù)副總裁張曉明對鈦媒體AGI表示,未來5-10年,AI制藥產(chǎn)業(yè)可能將迎來爆發(fā)期。因此,需要行業(yè)堅持持續(xù)做深度、做創(chuàng)新、應(yīng)用極致的前沿技術(shù)成果,加速整個藥物發(fā)現(xiàn)閉環(huán),在行業(yè)爆發(fā)中走在前列。
成立于2020年的BioMap百圖生科,是一家生命科學大模型平臺公司,由百度創(chuàng)始人、CEO李彥宏和原百度集團副總裁、BV百度風投CEO劉維共同創(chuàng)立,核心團隊包括原諾和諾德全球副總裁、原SAP全球副總裁等資深高管,和100余人的核心研發(fā)團隊。
經(jīng)過近五年的發(fā)展,百圖生科已經(jīng)成為生命科學基礎(chǔ)大模型的全球領(lǐng)跑者。截至目前,百圖生科總?cè)谫Y金額2億美元(約合人民幣14.54億元)左右,已擁有上千億參數(shù)量的全模態(tài)生物大模型xTrimo V3;覆蓋7種生物學跨模態(tài);超200款SOTA任務(wù)模型;服務(wù)全球500多家客戶,包括60余所QS世界百強大學和賽諾菲等多家跨國藥企;潛在訂單價值達20億美元。
目前,百圖生科已構(gòu)建覆蓋信息搜集-生物洞察-智能實驗的全流程AI發(fā)現(xiàn)平臺,助力生命科學企業(yè)實現(xiàn)研發(fā)效率提升、加速業(yè)務(wù)閉環(huán)。
今年4月25日,百圖生科發(fā)布全球首個AI生命科學基礎(chǔ)大模型驅(qū)動的生成式發(fā)現(xiàn)系統(tǒng)——百圖生科生命科學生成式發(fā)現(xiàn)系統(tǒng)。
其中,發(fā)現(xiàn)系統(tǒng)的核心是“發(fā)現(xiàn)助手”這一超級入口。據(jù)張曉明介紹,“發(fā)現(xiàn)助手”內(nèi)置深度搜索功能,提供深度推理、數(shù)據(jù)增強、任務(wù)執(zhí)行、組學預(yù)測等技術(shù)能力,通過智能交互理解需求,自動執(zhí)行多維度信息檢索與分析,最終生成結(jié)構(gòu)化深度報告,是全球率先在生命科學領(lǐng)域推出的專屬DeepResearch,同時也是更懂生命科學領(lǐng)域的知識助手。
BioASQ等多個行業(yè)評測結(jié)果顯示,“發(fā)現(xiàn)助手”在生命科學領(lǐng)域的表現(xiàn)中領(lǐng)先于DeepSeek-R1、OpenAI-o1-mini等其他通用AI產(chǎn)品,體現(xiàn)了生命科學領(lǐng)域的專業(yè)度。此外,百圖生科還面向特定領(lǐng)域提供創(chuàng)新系統(tǒng)方案,如智能發(fā)酵和智能細胞分析系統(tǒng),旨在以專業(yè)模型+高通量實驗的干濕閉環(huán)能力幫助客戶提升發(fā)現(xiàn)效率。
張曉明對鈦媒體AGI表示,目前,百圖生科為客戶提供SaaS和私有部署的“發(fā)現(xiàn)助手”,合作客戶包括清華大學生物醫(yī)學工程學院、中國農(nóng)業(yè)科學院、石藥集團等。
張曉明指出,與業(yè)內(nèi)已有的大模型企業(yè)的產(chǎn)品和方案相比,百圖生科“發(fā)現(xiàn)助手”更專注于AI For Life Science生命科學賽道,深度整合公司在生物數(shù)據(jù)理解和生命科學行業(yè)的深入經(jīng)驗,希望“發(fā)現(xiàn)助手”最終成為生命科學領(lǐng)域“專業(yè)-可執(zhí)行-專屬”超級助手,利用高效、先進的生成式AI技術(shù)助力藥物研發(fā)等多個領(lǐng)域,以生成式發(fā)現(xiàn)系統(tǒng)構(gòu)建生命科學大模型應(yīng)用落地,打造成為生命科學行業(yè)智能化轉(zhuǎn)型的最佳伙伴。
張曉明表示,下一步,“發(fā)現(xiàn)助手”產(chǎn)品將會持續(xù)迭代,發(fā)揮百圖生科的 AI 技術(shù)優(yōu)勢,逐步構(gòu)建起一套獨具特色的商業(yè)壁壘,為企業(yè)和相關(guān)研發(fā)機構(gòu)提供低成本、實用能力強、信息內(nèi)容更可靠的生命科學AI平臺。
張曉明強調(diào),在未來半年至一年的時間里,隨著產(chǎn)品能力的不斷深化,百圖生科在自身專注的領(lǐng)域中有望展現(xiàn)出更穩(wěn)固的優(yōu)勢和更鮮明的定位。
以下是百圖生科技術(shù)副總裁張曉明與鈦媒體AGI對話速記整理(有部分刪減):
鈦媒體AGI:百圖生科生命科學生成式發(fā)現(xiàn)系統(tǒng)的核心產(chǎn)品“發(fā)現(xiàn)助手”,為何說是第一個生命科學專屬DeepResearch?
張曉明:深度搜索(DeepResearch)只是它其中的一個核心能力,整體主要做生命科學研究,會根據(jù)你提供的課題出一個深度研究報告,從而節(jié)省前沿技術(shù)研究人員的時間和精力。雖然像 OpenAI 也推出了類似的功能,但他們的服務(wù)更偏向通用場景,這就導(dǎo)致在面對生命科學這種非常專業(yè)的領(lǐng)域時,大模型可能會出現(xiàn)一些不夠準確的結(jié)果。而我們是完全專注于生命科學,所以在專業(yè)性上更有優(yōu)勢。
事實上,生命科學領(lǐng)域是有很多專屬網(wǎng)站知識庫和權(quán)威數(shù)據(jù)源,需要專門面向生命科學行業(yè)方向的相關(guān)產(chǎn)品,而百圖生科生命科學生成式發(fā)現(xiàn)系統(tǒng),可以切實幫助到我們的客戶去解決實際場景下的成本、人員效率等相關(guān)問題和需求。
當下,我們的戰(zhàn)略重心放在企業(yè)級市場,而不是直接面向C端消費者。我們更希望生命科學領(lǐng)域的企業(yè)員工能夠高效地使用我們的產(chǎn)品,解決他們在實際工作中的難題,實現(xiàn)內(nèi)部增效。因此,我們沒有計劃進行通用C端用戶的擴展,而是堅定地聚焦于企業(yè)實際應(yīng)用場景,通過我們的專業(yè)能力,實實在在地幫助客戶提升研發(fā)效率、加速創(chuàng)新進程。
鈦媒體AGI:這款產(chǎn)品是什么時候開始立項的?這個過程中有哪些挑戰(zhàn)?
張曉明:去年10月,我們做了AI智能體等基礎(chǔ)技術(shù),當時Agent概念對于客戶來說,可能還相對新和超前。因此,我們是將前期的技術(shù)積累沉淀,并在今年真正做這款產(chǎn)品,尤其DeepSeek興起使得無人不談大模型,它確實是一個非常明確的信號。所以,如今是一個非常好的契機,把之前積累的技術(shù)和產(chǎn)品,為生命科學行業(yè)提供服務(wù)。
鈦媒體AGI:“發(fā)現(xiàn)助手”與深勢科技的玻爾平臺有何區(qū)別?
張曉明:區(qū)別還是挺大的。玻爾基于深挖科學文獻理解的基礎(chǔ)之上給予文獻判斷和總結(jié),這是它的核心功能點。
百圖生科生命科學“發(fā)現(xiàn)助手”上文獻只是眾多信源之一,還有更多的高質(zhì)量數(shù)據(jù)源,包括百圖自身構(gòu)建的大型生命科學數(shù)據(jù)圖譜、專屬知識庫、行業(yè)調(diào)研報告、搜索引擎尋找等數(shù)據(jù)也可以直接用,并且在這些數(shù)據(jù)源上做深度搜索,實現(xiàn)了DeepResearch的能力。并且提供了生信分析的功能,實際可執(zhí)行,更直接的提高了發(fā)現(xiàn)效率。
鈦媒體AGI:百圖生科生命科學生成式xtrimo“發(fā)現(xiàn)助手”,是否與王小川百川智能的醫(yī)療AI平臺產(chǎn)生競爭關(guān)系?
張曉明:這是一個非常好的問題。確實我們在做定位的時候,第一天就考慮了這個問題。
我們認為,臨床問診和生命科學研發(fā)之間其實有一條分界線。如果做醫(yī)療問診,就更偏醫(yī)療、臨床等上層鏈條,需要和醫(yī)院和衛(wèi)健委相關(guān)機構(gòu)形成生態(tài),更好的理解患者的檢測報告和患者對話;而我們更關(guān)注底層生命科學機理層面,比如藥物設(shè)計里邊的靶點發(fā)現(xiàn)、細胞分析等Science問題,要理解的也是原始的科學數(shù)據(jù),所以,兩個生態(tài)和技術(shù)都是不重疊的。
鈦媒體AGI:“發(fā)現(xiàn)助手”調(diào)用的是哪家大模型?為何首批沒接入百度文心大模型?
張曉明:目前,“發(fā)現(xiàn)助手”調(diào)用了多個大模型,首先是我們研發(fā)的生命科學專屬多模態(tài)模型,BioMap xTrimo大模型所帶來的專業(yè)能力,作為補充的才是阿里Qwen、DeepSeek等自然語言大模型,通用領(lǐng)域文本推理模型,在這個層面上,我們會接入和調(diào)用不同廠商的大模型產(chǎn)品,在眾多推理模型之上進行組合使用。我們不僅需要基于文本和數(shù)學的推理過程,更要讓它學會生物推理任務(wù)。
最后談?wù)剤?zhí)行任務(wù)過程。
我們確實希望給出專業(yè)的問答,所以利用百圖生科的生命科學領(lǐng)域圖譜和業(yè)界專業(yè)數(shù)據(jù)庫,通過推理把每一步路徑執(zhí)行和輸出,多輪獲取參考源的信息,并行觸發(fā)15路及更多語言搜索,如果內(nèi)容質(zhì)量不夠會重新優(yōu)化再搜索,經(jīng)過多輪執(zhí)行,讓這個信息直接可用,并且有權(quán)威性、不會帶來過多幻覺,才輸出給用戶。
我認為,當下幻覺是沒有辦法100%消除的,只能通過各種技術(shù)手段把幻覺概率降低,讓這個報告變得真正有用,而不是生成一個報告格式的非事實內(nèi)容。所以,我們犧牲了響應(yīng)速度,而更加傾向于實現(xiàn)更好的體驗、更實用且真正可執(zhí)行的平臺。
鈦媒體AGI:談?wù)勆虡I(yè)化。為什么百圖生科“發(fā)現(xiàn)助手”平臺不提供類似智譜的API接口進行銷售?
張曉明:當下其實我們沒有API,隨著發(fā)現(xiàn)助手能力逐步提升,標準版本可以更好的幫助到企業(yè)客戶時,我們可以再考慮開發(fā)API。當前,我們認為需要為企業(yè)用戶做一定定制,接入了企業(yè)自己的專屬數(shù)據(jù)的版本,打造企業(yè)專屬的助手效果更顯著。
鈦媒體AGI:三種交付模式SaaS、私有部署和一體機下,百圖生科的市場競爭力是什么?
張曉明:就百圖生科生命科學生成式發(fā)現(xiàn)系統(tǒng)而言,我們的SaaS是以平臺方式讓客戶進行試用和體驗,然后會對這些功能有一個直接判斷,真正我們向客戶提供的是一套企業(yè)級私有部署方案。
事實上,生命科學行業(yè)具有專屬的管線、靶點等比較機密的數(shù)據(jù),不愿意在公共平臺使用,所以,大部分企業(yè)和科研機構(gòu)依然采用私有部署方式,而SaaS更多提供試用和體驗,但并非我們主要向客戶提供的交付模式。
私有部署有兩種形式:一種是用戶自身擁有自建集群,我們把軟件系統(tǒng)方案部署上面;另一種如果用戶有云服務(wù),我們可以幫助他們構(gòu)建私有云的軟件系統(tǒng)部署。此外,我們還會與百度智能云、中科海光等提供國產(chǎn)硬件一體機交付能力。相對于其他一體機產(chǎn)品,我們注意力在生命科學范圍里面尋找高質(zhì)量客戶,更期待幫助他們提高效率,以及通過他們的使用反饋產(chǎn)品不斷迭代升級。這是我們提供上述多種形式交付模式的原因。
鈦媒體AGI:百圖生科目前對外提供藥物研發(fā)、生物制造、AI4LS平臺解決方案等。那么,這次新的百圖生科生命科學生成式發(fā)現(xiàn)系統(tǒng)產(chǎn)品,是結(jié)合解決方案一起提供,還是單獨銷售?
張曉明:百圖生科生命科學“發(fā)現(xiàn)助手”是企業(yè)級的發(fā)現(xiàn)提效方案。我們現(xiàn)在主要提供定制的、垂直的助手賦能客戶提效,這也是我們解決方案的一部分。與更多針對特定垂直領(lǐng)域的重度解決方案相比,發(fā)現(xiàn)助手是一個最便捷和廣泛服務(wù)專業(yè)客戶需求的解決方案,也可以和垂直解決方案聯(lián)合使用。
鈦媒體AGI:清華大學也有智譜、百川智能這類大模型公司,為什么清華大學生物醫(yī)學工程學院選擇與百圖生科合作?
張曉明:主要還是因為我們在過去四五年間一直深耕生命科學基礎(chǔ)大模型,在生物問題上有我們的獨特優(yōu)勢。劉鵬教授(清華大學生物醫(yī)學工程學院黨委書記、教授)團隊和我們有很深度的合作,他們?yōu)槲覀冞@款產(chǎn)品打磨提供了非常多原始需求和實際反饋,而我們幫助他們解決課題挖掘、知識問答、報告撰寫、報告潤色等痛點需求,核心在于我們比其他AI產(chǎn)品更懂生物,更能夠理解和解決深層次問題。
鈦媒體AGI:目前整個平臺處于試用狀態(tài),那么百圖生科團隊如何去做留存?如何實現(xiàn)商業(yè)壁壘?
張曉明:我們剛發(fā)布發(fā)現(xiàn)助手產(chǎn)品,所以當下客戶都處于靈活試用狀態(tài)。
下一步,我們不斷完善產(chǎn)品功能,深度溝通用戶需求,真正解決實際問題,當前主要還是作為一個客戶解決方案,去關(guān)注專業(yè)用戶的使用滿意度。長期而言,它會是一個面向生命科學領(lǐng)域場景的整體、統(tǒng)一的“超級”助手,在調(diào)用各種更深入的解決方案和功能上,乃至在整合用戶的其他工具和數(shù)據(jù)上,都可以發(fā)揮作用,屆時客戶會對此形成長期的用戶黏性。
至于商業(yè)壁壘,我們剛剛進入這個領(lǐng)域,從原來服務(wù)少數(shù)專業(yè)領(lǐng)域的深度需求,到現(xiàn)在面向更廣泛的需求提供方案,還談不上壁壘。但我們的思考是,真正的壁壘在于充分利用我們生命科學多模態(tài)的大模型,生命科學專業(yè)數(shù)據(jù),在功能上滿足自然語言大模型單純滿足不了的真實需求,真正可執(zhí)行的幫助客戶解決專業(yè)問題。
鈦媒體AGI:我們提供的服務(wù)當中,硬件成本很高,而且發(fā)現(xiàn)助手還是免費對外提供,百圖生科如何在這一業(yè)務(wù)中實現(xiàn)盈利?
張曉明:和其他大模型Agent產(chǎn)品一樣,前期我們確實要投入一些成本給用戶免費試用和體驗。但作為一個專業(yè)方案,用戶在獲取發(fā)現(xiàn)助手的高級功能、完整方案、做專屬的功能定制時,還是會給我們帶來商業(yè)收益。
從成本角度上,因為“發(fā)現(xiàn)助手”是回答和解決生命科學場景的問題,相對通用助手來說使用頻次并不高,我們在大模型的訓練和推理優(yōu)化方面積累了大量 AI 工程能力,實現(xiàn)了多輪性能優(yōu)化,從而降低了我們的服務(wù)成本。
鈦媒體AGI:之前百圖生科與賽諾菲簽訂合作,外界認為百圖生科專做AI生物制藥平臺。但今天我們看到,除了“發(fā)現(xiàn)助手”之外,百圖生科還提供智能發(fā)酵方案,那么,我們?nèi)绾卫斫獍賵D生科所在的AI生物制藥領(lǐng)域的發(fā)展?
張曉明:其實公司的定位一直是一個生物計算平臺、生命科學大模型平臺,我們比專注于任何一個具體領(lǐng)域的AI生物公司,都更自豪于我們基于基礎(chǔ)大模型能力帶來的領(lǐng)域擴展?jié)摿ΑY愔Z菲是我們最早的商業(yè)化客戶之一,是在生物制藥領(lǐng)域的,這一年多來其實我們的付費客戶已經(jīng)擴展到細胞基因療法、生命科學基礎(chǔ)研究、農(nóng)業(yè)和動物生物學、生物材料等很多領(lǐng)域,因為底層的蛋白和細胞等基礎(chǔ)大模型的高度關(guān)聯(lián)性。
在中國,我們特別重視生物制造領(lǐng)域的發(fā)展,因為這是中國產(chǎn)業(yè)戰(zhàn)略中非常關(guān)鍵的一環(huán),也是充分利用我們對生物反應(yīng)過程的理解而能帶來的重要效率提升進空間,我們很看好以智能發(fā)酵為代表的智能生物工藝發(fā)現(xiàn)系統(tǒng)的前景,和我們的智能抗體、智能細胞分析系統(tǒng)一起,會成為我們給客戶的核心解決方案之一。
(本文首發(fā)于鈦媒體App,作者|林志佳)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.