撰文丨王聰
編輯丨王多魚
排版丨水成文
多細胞生物中的不同細胞類型擁有相同的基因組,但由于基因表達的差異調控,它們表現(xiàn)出高度特化的功能特征。調控序列通過以細胞類型特異性的方式招募序列特異性轉錄因子(TF)來決定基因表達模式。染色質可及性是調控 DNA 的通用標志,可通過 DNA 酶 I 超敏感性測序(DNase-seq)和基于轉座酶可及染色質測序(ATAC-seq)進行測量。利用這些檢測方法,已經(jīng)在哺乳動物中開展了多項大規(guī)模工作以繪制全基因組范圍內的調控序列。然而,對于大多數(shù)物種而言,全面的細胞類型解析調控序列圖譜仍不可用。
利用深度學習(Deep Learning)模型直接從 DNA 序列中預測調控和表達信號,是現(xiàn)代基因組學領域的一個里程碑。最近,深度學習模型已被用于預測單細胞水平的染色質可及性和基因表達。此前,郭國驥教授團隊開發(fā)了女媧(Nvwa)模型,實現(xiàn)了細胞類型特異性基因表達的圖譜規(guī)模單細胞分辨率預測,還開發(fā)了華佗(Huatuo)模型,有助于在幾乎所有細胞類型中以單核苷酸水平解碼與疾病相關的調控序列。但遺憾的是,目前大多數(shù)細胞圖譜數(shù)據(jù)在靈敏度或通量方面存在局限性,這阻礙了高精度預測模型的生成。
以AlphaFold為代表的蛋白質結構預測模型已經(jīng)取得了巨大成功,而基因組學領域的預測模型仍有待實質性突破。
2025 年 7 月 8 日,浙江大學醫(yī)學院/良渚實驗室郭國驥教授團隊在國際頂尖學術期刊Cell上發(fā)表了題為:Modeling the vertebrate regulatory sequence landscape by UUATAC-seq and deep learning 的研究論文。
該研究建立了超高通量、超靈敏的單核 ATAC 測序技術(UUATAC-seq),可在一天內高效率高質量的完成一個物種的染色質可及性圖譜。基于該技術,研究團隊為五大代表性脊椎動物中繪制候選順式調控元件圖譜,開發(fā)了多任務深度學習模型——女媧CE(Nvwa
cis-regulatory element ) ,并實現(xiàn)了從基因組序列到單細胞水平調控元件圖譜的直接預測。
研究團隊發(fā)現(xiàn),脊椎動物調控語法的保守性明顯強于核苷酸序列本身,且該語法將脊椎動物調控原件序列在高維分類為不同的功能模塊,由此揭示細胞類型特異性基因表達的序列基礎。另外,女媧CE 模型在多項指標上,超越現(xiàn)有的基因組 AI 模型,并能精準預測合成突變對譜系特異性調控元件功能的影響。最后,團隊利用基因編輯實驗,首次驗證了完全由人工智能(AI)設計的人類疾病治愈性位點。這項研究為全面解讀基因組語言和建立數(shù)字生命模型奠定了堅實基礎。
脊椎動物基因組中的調控序列仍未被完全理解。為解決這一問題,研究團隊開發(fā)了一種超高通量、超靈敏的單核 ATAC 測序技術(UUATAC-seq),能夠在一天內構建出一個物種的染色質可及性圖譜。
利用 UUATAC-seq 技術,研究團隊在五個具有代表性的脊椎動物物種(哺乳類-小鼠、鳥類-雞、爬行類-守宮、兩棲類-蠑螈、水生類-斑馬魚)中繪制了候選順式調控元件(
cis-regulatory element, cCRE)的圖譜。
分析結果表明,不同物種間基因組大小的差異會影響順式調控元件(cCRE)的數(shù)量,但不會影響其大小。
研究團隊進一步推出一種大型任務深度學習模型——女媧CE(Nvwa
cis-regulatory element,簡稱NvwaCE) ,旨在解讀順式調控“語法”,并能直接從基因組序列中高精度地預測 cCRE 景觀。女媧CE證明了調控“語法”比核苷酸序列更具保守性,并且這種“語法”將 cCRE 組織成不同的功能模塊。
此外,女媧CE還能準確預測合成突變對譜系特異性 cCRE 功能的影響,這與因果數(shù)量性狀位點(QTL)和基因組編輯結果相一致。具體來說,女媧CE預測出了一個鐮狀細胞病的治愈性基因突變位點(HBG1-68:A>G),這一突變位點從未在單核苷酸多態(tài)性數(shù)據(jù)庫(dbSNP)或任何已發(fā)表的論文中被記錄過。進一步驗證實驗顯示,該位點在基因編輯后能夠實現(xiàn)胎兒血紅蛋白表達量的顯著提升,這也是首次在人類細胞中證明了基因組 AI 模型精準預測功能性位點的性能。
總的來說,該研究開發(fā)了能夠高效構建染色質可及性圖譜的UUATAC-seq技術,以及用于脊椎動物染色質圖譜預測的基因組 AI 模型——女媧CE(NvwaCE),這些成果為進一步破譯脊椎動物基因組的調控語言提供了寶貴資源。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(25)00686-5
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.