多種CRISPR技術被用于有針對性地改變或沉默基因,抑制蛋白質的產生。其中之一是CRISPRi(CRISPR干擾),它可以在不修改DNA序列的情況下阻斷基因和基因表達。與傳統CRISPR機制類似,引導RNA指導核酸酶(Cas)。然而,CRISPRi核酸酶結合到DNA而不進行切割,導致相應基因的下調表達。CRISPRi已成為在細菌中沉默基因表達的主要技術之一。然而,設計規則仍然缺乏明確定義。
直到現在,預測特定基因的CRISPRi性能一直是具有挑戰性的。但研究人員現在已經開發了一種使用數據整合和人工智能(AI)的機器學習方法,以改善未來這種預測的方法。科學家們利用了多個全基因組CRISPRi必需性篩選的數據來訓練機器學習方法。他們的目標是更好地預測CRISPRi系統中使用的工程引導RNA的功效。
研究人員發現,目標基因的基因特異性特征對全基因組篩選中引導RNA的減少有顯著影響。此外,結合多個CRISPRi篩選的數據顯著提高了預測模型的準確性,使引導RNA效能的估計更加可靠。該研究為通過預測引導RNA效能實現更有效的基因沉默策略提供了有價值的見解。
這項工作發表在《基因組生物學》雜志上,題為“通過混合效應機器學習和數據整合改善細菌CRISPRi引導RNA效能的預測”。
“不幸的是,全基因組篩選只能提供關于引導RNA效能的間接信息。因此,我們應用了一種新的機器學習方法,將引導RNA的功效與沉默基因的影響分離開來,”Würzburg RNA感染研究所(HIRI)的研究組長、Würzburg大學醫學院的副教授Lars Barquist博士解釋說。
該團隊開發了一種“混合效應隨機森林回歸模型,提供更好的引導RNA效能估計”。通過這樣做,他們為未來的CRISPRi實驗建立了可理解的設計規則。研究作者通過進行一個針對細菌基因的獨立篩選驗證了他們的方法,結果顯示其預測比先前的方法更準確。
“研究結果表明,我們的模型優于現有方法,對特定基因的CRISPRi性能提供了更可靠的預測,”Barquist研究組的博士生Yanying Yu說。
科學家們對發現引導RNA本身并非決定CRISPRi在必需性篩選中減少的主要因素感到意外。“與先前的認知相比,某些與基因表達相關的基因特異性特征似乎影響更大,”Yu解釋道。
研究還表明,整合來自多個數據集的數據顯著提高了預測的準確性,使引導RNA效能的評估更加可靠。
“通過整合多個實驗的培訓數據是創建更好的預測模型的關鍵。在我們的研究之前,數據不足是預測準確性的主要限制因素,”Barquist指出?!拔覀兊难芯繛殚_發更精密的工具以操縱細菌基因表達提供了藍圖,最終有助于更好地理解和對抗病原體。”
參考文獻: “Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration.”
編輯:王洪
排版:李麗
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.