編輯 | 蘿卜皮
讓 AI 來(lái)「控制」細(xì)胞的分化路徑,長(zhǎng)成紅細(xì)胞還是血小板全看 AI 的「旨意」?雖然聽(tīng)起來(lái)像是科幻小說(shuō)里的場(chǎng)景,但是「低配版」的調(diào)控已經(jīng)實(shí)現(xiàn)了。
西班牙巴塞羅那基因組調(diào)控中心 (CRG) 的研究人員開(kāi)發(fā)了一種人工智能工具,可以構(gòu)想自然界中從未見(jiàn)過(guò)的 DNA 調(diào)控序列。該模型可以根據(jù)自定義標(biāo)準(zhǔn)創(chuàng)建合成 DNA 片段,例如「在干細(xì)胞中開(kāi)啟該基因,使其發(fā)育成紅細(xì)胞而非血小板」。
此外,模型能夠預(yù)測(cè)特定細(xì)胞類型所需的基因表達(dá)模式所需的 DNA 堿基組合(核苷酸堿基:A、T、C、G)。
為了驗(yàn)證,研究人員化學(xué)合成了一系列模型設(shè)計(jì)的含大約 250 個(gè)堿基的 DNA 片段,并將其通過(guò)病毒轉(zhuǎn)染到小鼠血細(xì)胞中。這些片段能夠激活某些細(xì)胞中編碼熒光蛋白的基因,同時(shí)保持基因表達(dá)模式不變。轉(zhuǎn)染之后這些序列在隨機(jī)位置與基因組融合,實(shí)驗(yàn)結(jié)果與預(yù)期完全一致。
「其潛在的應(yīng)用非常廣泛。這就像編寫(xiě)生物學(xué)軟件,為我們發(fā)現(xiàn)了一種新方法,可以向細(xì)胞發(fā)出指令精確地指導(dǎo)它的發(fā)育和行為。」論文的第一作者、CRG 的 Robert Fr?mel 博士說(shuō)道。
這可以為基因治療開(kāi)發(fā)人員提供新途徑,為開(kāi)發(fā)微調(diào)患者基因、提高治療效果并減少副作用的新治療策略鋪平了道路。
該研究以「Design principles of cell-state-specific enhancers in hematopoiesis」為題,于 2025 年 5 月 8 日發(fā)布在《Cell》。
精準(zhǔn)控制細(xì)胞分化很難嗎?
在細(xì)胞分化過(guò)程中,轉(zhuǎn)錄因子 (TF) 的活性需要轉(zhuǎn)化為譜系特異性基因的高度特異性表達(dá)模式。
在血液干細(xì)胞分化的背景下,單細(xì)胞轉(zhuǎn)錄組學(xué)和基于成像的研究表明,關(guān)鍵 TF 在整個(gè)干細(xì)胞和祖細(xì)胞群體中以平滑、重疊的梯度表達(dá);相比之下,受這些因子調(diào)控的靶基因則表現(xiàn)出細(xì)胞狀態(tài)特異性的表達(dá)模式。
類似的重疊轉(zhuǎn)錄因子梯度伴隨細(xì)胞分化,涵蓋從多能性退出到器官形成,再到由其他成體干細(xì)胞進(jìn)行的組織再生等各種系統(tǒng)。事實(shí)上,轉(zhuǎn)錄因子之間的比例改變足以建立特定的基因表達(dá)程序。
但是,增強(qiáng)子如何將同一組轉(zhuǎn)錄因子中的數(shù)量失衡轉(zhuǎn)化為高度特異性的活性模式呢?盡管干細(xì)胞中譜系轉(zhuǎn)錄因子表達(dá)豐富,但譜系和細(xì)胞周期基因是如何被沉默的?此外,癌細(xì)胞如何在主要依賴相同的核心轉(zhuǎn)錄調(diào)控因子的情況下實(shí)現(xiàn)干細(xì)胞和祖細(xì)胞程序的共表達(dá)?
這個(gè)過(guò)程中還有諸多問(wèn)題與需要解決,人工智能的發(fā)展帶來(lái)了解決途徑。但是,人工智能模型的開(kāi)發(fā)需要大量高質(zhì)量的數(shù)據(jù),然而 TF 中的增強(qiáng)子數(shù)據(jù)一直都很稀缺。
「要?jiǎng)?chuàng)建生物學(xué)的語(yǔ)言模型,你必須理解細(xì)胞的語(yǔ)言。我們著手破譯增強(qiáng)子的這些語(yǔ)法規(guī)則,以便我們能夠創(chuàng)造出全新的單詞和句子?!乖撗芯康耐ㄓ嵶髡?、CRG 研究員 Lars Velten 博士解釋說(shuō)。
借助 AI 的力量調(diào)控造血干細(xì)胞
基因表達(dá)受增強(qiáng)子等調(diào)控元件控制,增強(qiáng)子是 DNA 中的微小片段,可以控制基因的開(kāi)啟或關(guān)閉。為了修復(fù)錯(cuò)誤的基因表達(dá),研究人員可以梳理基因組,尋找恰好滿足其需求的自然存在的增強(qiáng)子,并將研究范圍限制在進(jìn)化產(chǎn)生的序列上。
在此,CRG 的研究人員研究了 38 個(gè)關(guān)鍵 TFBS 在最小合成增強(qiáng)子中造血分化過(guò)程中的功能和相互作用。
圖示:流程概述。(來(lái)源:論文)
具體來(lái)說(shuō),他們將單個(gè) TF 或 TF 對(duì)的結(jié)合位點(diǎn)以不同的排列方式、不同的基序親和力和不同的重復(fù)次數(shù)放置在隨機(jī) DNA 上。利用慢病毒大規(guī)模并行報(bào)告基因檢測(cè)(lentiMPRA),在小鼠造血干細(xì)胞(HSC)分化的 7 個(gè)細(xì)胞狀態(tài)下,測(cè)定了 64,400 個(gè)此類構(gòu)建體驅(qū)動(dòng)轉(zhuǎn)錄的能力。
獲得的數(shù)據(jù)使他們能夠全面表征結(jié)合位點(diǎn)的功能及其在分化過(guò)程中的成對(duì)相互作用。
研究人員發(fā)現(xiàn),含有單個(gè)「譜系因子」(例如 Spi1、Cebpa、Gata1 和 Fli1)結(jié)合位點(diǎn)的增強(qiáng)子可以激活轉(zhuǎn)錄,但這些位點(diǎn)的特定組合處于非活性狀態(tài),甚至充當(dāng)阻遏物,從而產(chǎn)生了對(duì)轉(zhuǎn)錄因子表達(dá)比例敏感且特定于任一因子占主導(dǎo)地位的細(xì)胞狀態(tài)的增強(qiáng)子。
相反,一些「干細(xì)胞因子」(例如 Runx1 和 Meis1)的結(jié)合位點(diǎn)起著抑制因子的作用,但在特定組合下允許或支持活性。這些相互作用共同作用,將重疊的 TF 梯度轉(zhuǎn)化為高度細(xì)胞狀態(tài)特異性的二元活性模式。
相比之下,在常用于 MPRA 研究的人類白血病細(xì)胞系(K562)中,激活因子通常占主導(dǎo)地位,而抑制性相互作用很少。
說(shuō)明這些規(guī)則與天然基因組中增強(qiáng)子的功能相關(guān),并利用它們自動(dòng)設(shè)計(jì)出在用戶自定義的造血祖細(xì)胞狀態(tài)組合中具有活性的新型增強(qiáng)子??偠灾?,這些數(shù)據(jù)強(qiáng)調(diào)了 TFBS 之間的負(fù)協(xié)同作用是造血過(guò)程中細(xì)胞狀態(tài)特異性增強(qiáng)子的設(shè)計(jì)原則。
論文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(25)00449-0
相關(guān)內(nèi)容:https://phys.org/news/2025-05-ai-dna-genes-healthy-mammalian.html
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.