其實很早就想整理網絡藥理學的內容了,主要是很多果友咨詢,但確實時間上抽不開身。在生信分析時,通過差異基因來選表型、定基因是常規策略;網絡藥理學、WGCNA或者聚類分析構建預后模型也是常用生信分析方法。關于WGCNA和聚類分析構建預后模型,我們曾經做過整理,這次我們重點來分享網絡藥理學。
從本質或定義上來說,網絡藥理學(Network Pharmacology)是一種基于系統生物學和計算生物學的方法,旨在理解藥物在復雜生物系統中的作用機制。與傳統藥理學通常關注單一靶點不同,網絡藥理學將藥物、靶點、疾病和生物網絡中的其他元素視為一個整體。其核心思想是“多靶點、多通路”協同作用,從而 研究它們之間的互作以及相互依賴關系。
數據層面上網絡藥理學需要整合化合物靶點(如TCMSP、STITCH)、疾病相關基因(DisGeNET、OMIM)、通路(KEGG)等數據庫;分析方法上則綜合網絡分析(如PPI互作、模塊挖掘)和拓撲特征(度中心性、介數中心性)預測關鍵靶點。同時還可以結合分子對接(Autodock)或體外、體內實驗,驗證核心靶點或通路。非常適合研究復雜藥物系統(如中藥),避免單一靶點的局限性。
網址:https://www.tcmsp-e.com/tcmsp.php
第一步、中藥成分篩選。 網絡藥理學第一步,是我們要清楚研究對象的主要成分。這里需用到 TCMSP(The traditional Chinese medicine systems pharmacology database and analysis platform)數據庫,中文全程為 中藥系統藥理學數據庫與分析平臺。比如我們研究枸杞對腦卒中是否有作用,作用靶點是什么。為了確認枸杞對生物體真正起功效的成分,我們依據OB值和DL值進行篩選。OB值(oral bioavailability),即生物利用度,指的是制劑中藥被吸收入人體循環的速度與程度(參考值為30%);DL值(drug-like properties),即類藥性,指的是化合物與已知藥物的相似性。具有類藥性的化合物并不是藥物,但是具有成為藥物的可能(參考值為0.18)。篩選中,OB值和DL值越大越好!
網址:https://pubchem.ncbi.nlm.nih.gov
第二步、結構信息獲取。PubChem,是一個生環化材中應用分子的數據模型庫,由NCBI維護,可以查詢藥物成分的 SMILES ID。輸入主要成分的名稱,我們可以獲得某個成分的SMILES ID( 化學結構的線性表示法 )。
我們以枸杞主要成分之一Sitosterol alpha1為例演示,SMILES ID: C/C=C(/CC[CH]2[CH]4[CH]([C@H]4C)O)C)C)\C(C)C。
網址:https://www.novopro.cn/tools/mol2smiles.html
或者在TCMSP下載藥物成分的3D結構式,再通過3D結構在線轉換獲得SMILES ID。得到的SMILES ID: CC=C(CC[CH](O)CC[C@]4(C)[C@H]3CC[C@@]21C)C(C)C。
步驟三、化合物再篩選。第一步是 通過OB值和DL值對藥物成分進行過濾,這一步則是在藥代動力學層面探究藥物成分的有效性。這里用到SwissAMDE數據庫,用于藥代動力學屬性分析,并預測一個或多個小分子的ADME參數、藥代動力學性質、類藥性。只需要將第二步獲得的SMILES ID粘貼到對話框即可,結果如下。
篩選依據主要看兩個參數:①胃腸道吸收效率(GI absorptoon為high);②類藥性(Druglikeness里的參數至少有兩個YES)。如果不滿足上述條件,就把該成分剔除掉,不再用于后續分析,再嘗試其他成分。顯然,枸杞中Sitosterol alpha1不符合上述條件。真正在課題中,我們需要繼續篩選其他有效成分。
第四步、靶點預測。得到有效藥物成分以后,我們可以通過SwissTargetPrediction預測藥物成分可能的生物學靶點。該網站主要利用化合物的2D和3D結構相似性來推斷與已知藥物靶點的潛在相互作用。
得到的靶基因可以CSV的形式導出。我們可以保留“Common name列”的所有基因名。Probability表示成分對應Target的可能性。為了盡可能保留多的target,我們無需刪除,除非Probability = 0。在我們的示例中,排除 Probability = 0的基因,得到62個靶點。
篩選到的靶基因結果(部分)
第五步、疾病靶點獲取。在得到靶基因之后, 我們需要找到這些 Target是不是跟某種疾病密切相關。怎么辦呢?就是要有疾病用基因特征或基因集來定義的思維。GeneCards網站可自動收錄來自約150個網站的以基因為中心的數據,包括基因組、轉錄組、蛋白組學、遺傳、臨床及其功能的信息,可用于疾病相關基因的檢索。
網址:https://www.genecards.org/
輸入疾病名稱后,可在右上角Export處直接導出疾病相關基因(最多可以下載10000行)。然后,我們根據"Relevance score"列的中位數或平均值或TOP2000等標準對疾病靶點基因進行過濾,比如只保留所有大于該中位數的Gene Symbol。
第六步、靶點整合,疾病特征基因確認。除 GeneCards外,OMIM是一個綜合的、權威的研究人類表型和基因型關系的數據庫,收錄了超過16000個基因的疾病信息。DisGeNET也收集了遺傳性疾病的信息,包括遺傳突變位置、基因變異性質、蛋白表達及功能等,也可以獲得相應的疾病基因集。為了保證疾病基因集的準確性,我們把從這三個網站得來的基因取交集(韋恩圖)。
網址:https://molbiotools.com/listcompare.php
第七步、交集分析。為了確定藥物成分與疾病的關系,需要把藥物成分靶基因(步驟四)與疾病特征靶基因(步驟六)再取交集。這里的交集基因就是藥物成分作用于疾病的潛在靶點。如果沒有得到交集基因,則該次分析失敗,可以更改疾病再進行分析。示例數據有32個交集基因。
網絡藥理學分析做到這一步,主要分析就完成了。接下來我們就可以通過STRING數據庫和Cytoscape軟件進行核心靶點篩選(第八步),并借助在線工具或者代碼完成富集分析(第九步)。這些內容在純生信21天教程里都有詳細的推文和視頻解讀,我們不再贅述。
從整體思路來講,網絡藥理學是藥物→基因→疾病的綜合分析,是一種特殊的生信分析。網絡藥理學(以及衍生的網絡毒理學)文章在2023-2024年經歷了過山車式的熱度變化,其核心套路已被拆解。隨著內卷加劇和審稿人認知升級,單純藥理學分析已很難發表。
芒果之見:2025年網絡藥理學可以①引入時間序列(如藥物處理不同時間點的轉錄組),或者②結合scRNA-seq數據定位靶點細胞亞群,或者③多組學整合,代謝組+蛋白互作+表觀調控;也可以結合孟德爾隨機化驗證靶點-疾病的因果關聯,或者基于CRISPR篩選驗證樞紐基因,如DepMap數據輔助選題;又或者用TCGA/TARGET數據庫分析核心靶點的預后價值。這些內容也是純生信突圍的方向!因此,網絡藥理學的突圍,也是生信分析的突圍!大家一起加油,爭取早日發表論文~~
參考資料,僅用于學術交流。
https://mp.weixin.qq.com/s/XpmMWJXE8qfzrU3PBoCwSA
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.