不少人懷疑,今年的諾獎“偷懶”了。
除了備受關注的諾貝爾生理學或醫學獎“MicroRNA”相關研究外,今年諾貝爾化學獎、物理學獎均被AI相關研究拿下:
2024年諾貝爾化學獎授予華盛頓大學的大衛·貝克,以表彰其在蛋白質設計方面的貢獻,另一半則共同授予谷歌旗下人工智能公司DeepMind(深度思維)的戴米斯·哈薩比斯和約翰·江珀,針對結合AI(人工智能)模型對蛋白質結構預測領域的研究。
而今年的諾貝爾物理學獎,則被授予約翰·J·霍普菲爾德(John J. Hopfield)和杰弗里·E·辛頓(Geoffrey E. Hinton),以表彰他們“在實現使用人工神經網絡進行機器學習”方面的基礎性發現和發明。
逢AI必獲獎,諾獎看似在躺平式“響應”AI這一時代主題,但并非諾獎評委有意“怠工”,而是恰恰說明AI早已滲透到了最前沿的科研領域,甚至能起到關鍵革新作用。
正如此次獲獎的DeepMind開發的AlphaFold(阿爾法折疊)大模型,早已在醫藥和美妝使用的蛋白(肽)類成分的開發中起到關鍵作用。
但AI在美妝科研端的應用,又何止一個AlphaFold。
美妝科研再次踩中諾獎科技
在過去,AI在美妝行業的應用大多都在臺前。
比如歐萊雅集團用BeautyGenius為消費者測膚并進行個性化推薦,采用CREAITECH生產內容;而雅詩蘭黛與微軟合作AI innovation Lab主要用于增強消費者與旗下品牌的關聯;寶潔早已開始用AI進行消費者行為分析,深度輔助市場決策和供應鏈管理。
值得一提的還有,作為迪奧、資生堂等397家知名品牌的AI測膚SaaS解決方案供應商,美圖宜膚將AI應用到基礎研究領域,通過AI對43萬名參與者皮膚狀態進行研究。該研究利用全景式AI測膚系統美圖宜膚識別皺紋發展和嚴重程度的關鍵拐點,發現了不同年齡層的衰老“拐點”,將深度學習技術應用于衰老檢測,建立皮膚維度測量標準,并探索影響皮膚特征的靶點,并參與制定、發布了《?體?膚分齡抗衰?評價標準表》團體標準。
顯然,在美妝科研的大幕后,AI早已開始發光發熱,尤其是今年獲得諾獎的Deepmind,結結實實地“踩”到了美妝科研的腹地。
據《FBeauty未來跡》了解,AlphaFold已預測出約100萬個物種的超過2億種蛋白質結構,幾乎涵蓋科學界已編錄的每一種蛋白質。這意味著,曾因氨基酸排列組合以及折疊方式帶來“維數災難”的蛋白、肽類成分開發,在AI大模型AlphaFold的篩選之下,可以從“大海撈針”變成了“定向預測”。
如果將開發一個肽類成分比作買彩票,AlphaFold大模型類似于將過往所有彩票數字組合(氨基酸組合)和中獎結果(功效)進行統計,并建立一套準確的算法。當科研人員需要某種目標功效(特定中獎結果)時,可以讓AlphaFold預測出目標蛋白、肽類分子的結構(新一期的數字組合)。
科研人員不用再一次一次實驗測試各種功能蛋白、肽類成分的濕實驗模式(買很多彩票),而是先測算出結果(干實驗),再通過一次“濕實驗”(買一張彩票)驗證結果是否達到預期的結果(中獎)。
在抗衰需求推動的肽類成分盛行的當下,AlphaFold將過去難度和成本極高的功能蛋白、肽類成分科研工作,變得成本、時間可控,且準確率更高。
相關資料顯示,通過AlphaFold預測的蛋白質結構與科學家之前通過實驗揭示的結果幾乎一致(約90%)時,《科學》雜志甚至評論,人工智能技術讓人類無需實驗即可了解蛋白質結構。
據第十四章品牌創始人梅鶴祥介紹,在新藥物開發領域,AI的介入可以降低20%的研發成本,提升20%命中率,并縮短20%研發周期。在美妝科研領域,AI大模型的應用可以讓環肽一類 “英雄(Hero)成分”的科研至少降低一半開發成本,縮短3-5年的研發周期。
更重要的是,AI技術的介入,正在改變美妝科研的邏輯:過去的科研是通過不斷用濕實驗試錯,從而找到最正確的解決方案。而現在的邏輯已經變先給到想要的結果,讓AI預測(干實驗),然后用濕實驗驗證正確性。
可以說,AI作為一種高效的統計學工具,在眾多變量組合中高效且準確地找到最好的解決方案,極大降低了科研過程中的試錯成本(時間、精力、資源)。
例如過去青蒿素的發現過程中,需要在青蒿提取物里10000多個有效成分不斷分離,進行試驗的驗證,通過10余年的時間,投入大量的人力物力,才找到最終的青蒿素分子,而現在AI技術的應用,可以提升開發效率。
而現在,上海家化在青蒿素成分在美妝成分應用時,采用AI網絡藥理學技術對從青蒿提取物的153種成分、1080個活性靶點中,找到了64個舒緩相關蛋白,對應88個成分,涉及調控炎癥相關的蛋白,加速完成了其在美妝行業應用的科研進程。
事實上,AI大模型的應用,在美妝科研領域的應用模式遠不止于肽類成分的開發,梅鶴祥表示,在類似新藥開發完整過程的ADMET各不同流程的研究,均已融合相關的人工智能技術。
而相關的AI工具,可以應用到美妝科研的方方面面。
這門通過計算機科技解決生物技術問題的學科,被統稱為計算生物學(Computational Biology,指開發和應用數據分析及理論的方法、數學建模、計算機仿真技術等,用于生物學、行為學和社會群體系統的研究的一門學科)。
近年AI領域的技術大爆發和算力暴漲,以及各種大模型的應用,讓計算生物學加速走向科研舞臺。其中,基因序列比較、基因表達模式的分析到全基因組關聯研究等,蛋白開發都是計算生物學的具體應用。
《深度 | 三問諾獎科技miRNA,如何顛覆美妝研發?》中提及miR相關功效成分開發,也會大量運用AI來進行成分結構預測。
與此同時,在近年十分熱門的合成生物領域,AI與計算信息學、生物信息學在發酵工程中的跨領域運用,也能大大優化發酵前期的菌種篩選、發酵過程的優化放大和發酵產物與護膚功效之間的精準匹配,有效提升了美妝功效成分的開發效率。
可見,AI已經被應用幾乎所有最前沿的到美妝科研領域中。
“AI競賽”已開幕,美妝科研迭代加速
對AI應用的想象,永遠不要過于保守。
在具體實操中,美妝企業對AI的接受程度,遠比想象中要高。從成分開發,到配方、香味、膚感設計,直至專業的定制化服務,均有涉獵:
不難看出,從品牌、到代工、原料企業,均在使用AI完成一些含有巨大變量的預測,或者大批量個性化的對比工作。以此替代過去需要大量人工和專業性的工作,提升科研產出效率。
而AI科技的應用也讓第三方科研機構,在美妝科研領域擁有更為活躍的表現。
僅在蛋白、肽類成分開發領域,我國就有清華大學人工智能產業研究院孵化的AI 制藥企業華深智藥、北京分子之心、浙江清華長三角研究院、錚信分子生物技術研發中心等第三方研發機構入局。
《FBeauty未來跡》曾在《計算生物學“神助攻”,肽類原料開發駛入快車道》一文中提及,清華長三角研究院正式發布了ACRDC活性肽智能深度數據庫,通過KEPLER 90i??計算生物學平臺建立了靶點數據集和天然活性肽數據集的智能深度分析與關聯預測體系?;诹龅挠嬎悖ǖ鞍?、肽類成分與受體的結合程度),開辟了與AlphaFold不同路徑的蛋白、肽類成分開發路徑。
據了解,該研究院基于炎癥性衰老前沿靶點的HMGB1的靶向環肽cIY-8,是首個日化領域直接靶向炎癥性老化的環肽分子。目前,貝泰妮已經與ACRDC展開合作,雙方的合作不僅僅局限于原料定制化、開發,還會越來越多地深入到基礎研究領域。
在國外,哈佛醫學院開發的miniprot以及愛爾蘭生物公司基于人工智能搭建的生物活性肽查找器Magnifier NπΦ也投入了使用,借助AI預測的肽可使臨床功效驗證的成功率提高至80%。解鎖了共計超過600萬種植物肽的數據,并發現PeptiYouth和PeptiStrong成分。
另一方面,一些國內外也有許多主流的科技公司,均在開發一些人工智能模型,能夠直接或間接參與到美妝科研領域。
資本和政策的支持,也在進一步加速AI美妝以及各行業滲透的進程。
相關數據顯示,2023年,全球計算生物學領域發生82起投資事件,總融資金額約為 93 億人民幣,其中深勢科技、Causaly、騰邁醫藥、Superluminal Medicines、分子之心和本導基因等企業,均受到了資本市場的青睞。
在國內,多地已經推行鼓勵AI與各產業結合的相關政策,例如上海市科委制定了《上海市計算生物學創新發展行動計劃(2023—2025年)》,設立了上海市科技創新行動計劃“計算生物學”專項 ,并于今年4月組織了首屆上海國際計算生物學創新大賽。
大賽得到了中國科學院上海藥物研究所原創新藥研究全國重點實驗室、中國銀行上海市分行、華為云計算技術有限公司、臨港實驗室、上海人工智能研究院、東方美谷企業集團股份有限公司等多家企事業單位的支持。
在產業端,Mordor Intelligence發布的市場研究報告數據顯示,全球計算生物學市場正呈現出強勁的增長勢頭,規模預計將從2023年的68億美元增長到2028年的127.2億美元,預測期間的復合年增長率為13.33%。其中,北美地區是最大的市場,美國是行業內領先國家,政府每年用于發展計算生物學的平均支出約為1.4 億美元。[2]
在這樣的大背景之下,美妝產學研鏈條與AI的產業下沉開啟了雙向奔赴。
AI 加速普及,但仍有 3 大“攔路虎”
雖然美妝科研領域目力所及皆可AI,但事實是,AI還遠未能發揮“十成功力”,就像人工智能輔助駕駛一樣,還遠沒有到人類可以完全“放下方向盤”的階段。
復旦大學復雜體系多尺度研究院院長馬劍鵬就明確表示,蛋白質結構預測技術AlphaFold2雖然很強大,但還遠沒有達到能夠取代實驗的水平。
梅鶴祥也表示,AI目前在美妝科研領域處于輔助階段,還不能真正意義上做到完全替代。
一方面,AI大模型的開發和培養,需要大量穩定性數據的采集,通過足夠數量的數據進行“喂食”學習,加上精心設計的算法,才能提升計算結果的精度,好比給一個嬰兒看了足夠多的水果圖片,并告訴他從什么維度進行判斷,經過足夠長時間的學習,他才能在看到水果時作出準確的判斷。
例如在KEPLER 90i??的建立過程中,清華長三角研究院許多先將多肽進行編碼,變成計算機可識別的語言,從“教孩子認字”學起,才能實現后期對1000多種肽的鑒定。
但目前,一些擁有實力的生物醫藥企業,均擁有自己的數據庫和算法,但數據的孤島效應使得各方的數據和算法兼容性較差。
沒有足夠多量的精準的數據和結果對應,會降低干實驗(AI預測)與濕實驗(實際測試)結果的一致性。因此,美妝科研只能在一些確定性較高的領域充分“相信”干實驗的結果。
另一個難題在于,AI美妝科研領域應用的準入門檻較高,相應的人才較為匱乏。
由于涉及到大計算機科學和生物學、網絡藥理學等多個學科的跨界,一家公司完全掌握AI模型的應用需要數年的時間,且還需要大量專業人才的培養。
“用AI的人不太懂生物,懂的人不太會用AI,需要一個學習過程。”梅鶴祥打趣地說道?!八惴ㄊ且粋€黑盒,將藥學家、生物學家、算法設計人員,在企業內整合到一起并不容易?!?/p>
更讓美妝企業難以適從的是,AI技術更新迭代太快。
短短6年時間,AlphaFold已經完成3次迭代,并不斷增加參數維度,提升計算的復雜度。事實上在計算生物學的研究思路之下,干濕結合的數據閉環也在不斷迭代,通過“假設-驗證-優化假設”的方式,不斷提升研發效率。
技術的加速迭代,對使用者也提出了更高的要求。
從整體上來看,科研端依舊對AI的應用保持積極的態度。馬劍鵬表示“人工智能技術是新時代的望遠鏡,也是顯微鏡” 。顯微在于AI帶來更精準、高效的研發模式,而望遠鏡則指AI在未來大量應用的確定性。
雖然目前AI模型還只是美妝科研的一個輔助工具,但可以預見的是,未來隨著更多企業的入局,以及AI自身的加速迭代,會有更多實際成果應用到美妝領域。
而今年一系列AI相關諾獎的出爐,正是對AI未來廣闊應用前景的一個積極預言。
注:
[1] 毛開云,江源,袁銀池,張華,周麗萍,江洪波 2023年計算生物學科技發展態勢
[2] Mordor Intelligence. 計算生物學市場規模和份額分析- 增長趨勢和預測(2023-2028)[EB/OL]. [2023-12-25].
作者/陳龍
編輯/吳思馨
校對/桂玉茜
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.