*僅供醫學專業人士閱讀參考
2025年 6 月 25 日,谷歌DeepMind 團隊推出了開創性的人工智能模型 AlphaGenome,并在預印本平臺同步發布了題為
AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model的論文。
AlphaGenome 是新一代基因組 AI 模型,可以從最長可達 100 萬個堿基的 DNA 序列出發,預測上千種與基因調控相關的分子屬性,并快速評估單點變異的功能影響。得益于這種“長距離+高精度”組合,再配上秒級的對照推理,模型可在瞬間給出任何單點突變對所有調控層面的功能分數!
在 22 項序列-功能與 26 項變異-效應基準測試里幾乎全面領先,被認為可將非編碼突變解析、靶點挖掘和基因調控療法研發從“實驗瓶頸”推進到“計算先行”的新階段!
紀念斯隆-凱特琳癌癥中心基因組學家 Caleb Lareau 評價稱這項工作“是該領域的里程碑:首次把長程上下文、單堿基精度和跨任務最佳表現融于一體”。
《自然》雜志發表的評論文章稱,AlphaGenome是破解基因組 98% 非編碼“暗物質”的一把新鑰匙。
在人類基因組草圖問世近 25 年后,這部長達 31 億“字母”的巨著仍有大片內容難以讀懂,尤以占 98% 的非編碼區最為棘手。這些基因暗區雖然不編碼蛋白質,但卻可以通過極為復雜的機制調控蛋白質編碼進程。
非編碼區域包含編碼基因的啟動子、增強子、剪接信號、三維折疊“拉鏈”等調控元件,大量全基因組關聯研究(GWAS)發現,超過九成與復雜疾病相關的遺傳信號都落在這些區域。非編碼區域好比隱藏的調音臺:微小突變可能就會改變基因何時、何地、以多大力度表達,牽動發育、免疫、代謝乃至腫瘤發生的整體網絡。
因此,深入解析非編碼區域不僅能解釋傳統“蛋白序列無異常卻患病”的謎團,還為靶點發現、基因調控療法(如 ASO、CRISPR-a/i)打開新通道,是精準醫學不可或缺的突破口。
在 AlphaGenome 出現之前,研究者想要弄清非編碼 DNA 對疾病的影響往往受限于“三大瓶頸”。
一是實驗通量低:要驗證一個遠程增強子或剪接信號是否真能調節基因,需要逐級進行多項實驗,動輒幾個月,成本巨大。
第二,傳統算法無法兼顧長度和精度。早期模型要么聚焦幾百個堿基的小窗口卻看不見長距離環路;要么增大到幾十萬堿基卻丟失單堿基分辨率,無法同時捕捉微小突變和百萬級上下文。
三是信息割裂,基因表達、染色質開放、轉錄因子結合和 3D 結構等調控讀數被分散在不同數據庫和獨立工具里,缺乏“一站式”整合,給科研工作帶來很多不便。
而AlphaGenome可以一次閱讀最長 100 萬個堿基的 DNA 片段,并且在單堿基分辨率上同時輸出上千項讀數:從轉錄起止位點、RNA 剪接量,到染色質開放度、3D 環路、蛋白結合位點等十多個調控模態。
得益于這種“長距離+高精度”組合,再配上秒級的對照推理,模型可在瞬間給出任何單點突變對所有調控層面的功能分數。在 DeepMind 的演示中,AlphaGenome 準確預判了與白血病相關的某些非編碼突變會間接激活鄰近致癌基因。
當然,目前的 AlphaGenome 還處于「嬰兒」階段。目前該模型僅使用人類與小鼠數據訓練,尚未針對其他物種或個人基因組做全面驗證;對跨越十萬堿基以上的遠程調控預測也仍待改進。
冷泉港實驗室計算生物學家 Peter Koo 指出,AlphaGenome 還未納入細胞動態變化因素,例如蛋白質水平和 DNA 化學修飾的時空波動。Koo 預計,未來研究人員將借助 AlphaGenome 設計精準調控 DNA 序列,或通過虛擬實驗模擬細胞對遺傳變動的反應。目前,非商業研究者已可通過編程接口訪問模型,更完整的開放版本也在規劃中。
DeepMind 也呼吁學術界通過新開放的 AlphaGenome API 共同驗證與擴展模型,期望“與全球研究者一道,將對 DNA 指令的理解推向新的深度”,并明確指出未來還將把模型能力延伸到更多物種、更多組織類型和更多調控模態,以支撐精準醫學和合成生物學的下一波突破。
總之,奇點已近!
參考文獻:
https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.