20多年前,科學家首次對人類基因組進行測序。該研究最大的驚喜之一是人類基因組包含的基因數量并沒有想象中的多,僅不到科學家預測的三分之一,似乎不到3萬個基因及其編碼的蛋白質就足以構建和運作人體。近期研究顯示人類基因數量甚至可能更低,只有大約2萬個基因。
但是,一項針對“黑暗蛋白質組”的新研究分析表明,科學家們錯過了數千個以前被忽視的基因組片段中的非傳統基因,這些基因產生的蛋白質比平均蛋白質要小。新發現的基因及其產物可能會顛覆人類生物學的各個方面,并加速醫學發現,例如一個新發現的基因產生了一種微型蛋白質,這種蛋白質似乎是兒童癌癥的關鍵。該研究由來自美國、英國、德國、瑞士、中國、新加坡等國家的研究人員合作完成,文章近期發表在預印本bioRxiv上。
Salk生物研究所的化學生物學家Alan Saghatelian表示:“除非我們知道黑暗蛋白質組中的蛋白質是什么以及它們是如何起作用的,否則我們治療疾病的能力將受到限制。”
該研究的領導者之一、密歇根大學醫學院兒科神經腫瘤學家John Prensner表示,之所以開始研究黑暗的蛋白質組,是因為其在已知基因中尋找癌癥相關基因的許多研究都是空手而歸。“我對基因組的其余部分所能提供的東西產生了興趣。”
研究團隊擴展了基因的標準定義。基因通常被認為是由一個長長的蛋白質編碼DNA序列組成,稱為開放閱讀框(ORF),包括開始和停止閱讀的信號。一個細胞將ORF序列轉錄成信使RNA,信使RNA被傳送到核糖體,核糖體將氨基酸序列組裝成蛋白質。一個典型的ORF之前也有一個DNA片段,它吸引了基因被讀取所需的蛋白質。如果一個ORF編碼了一個含有100個或更多氨基酸的蛋白質,那么它就被認為是一個基因。
但是,針對酵母、蛇和人類等各種生物學研究近期發現了大量所謂的非規范ORF(ncORF)。ncORF缺乏開頭片段,比平均水平短。但是它們經常被轉錄成RNA,一種被稱為核糖體分析或核糖序列分析的方法表明,許多轉錄的RNA附著在核糖體上,它們可能被翻譯成短氨基酸鏈——甚至是含有少于12個氨基酸的蛋白質。ncORF的翻譯已經在人類細胞類型和疾病狀態中被觀察到,對蛋白質組學、基因組學和臨床科學具有重要意義,但對ncORF翻譯對人類蛋白質組的貢獻的了解仍然缺乏。
研究團隊嘗試利用參考注釋的蛋白質組學證據,以鑒定翻譯成人類蛋白質的ncORF,為此擴大了PeptideAtlas平臺的范圍。利用295個蛋白酶消化質譜(MS)蛋白質組學數據集(包括35億個MS/MS譜)和118個HLA免疫肽富集數據集(包括2.4億個MS/MS譜),研究創建了人類非HLA肽圖譜2023-06和人類HLA肽圖譜2023-11(圖1b)。利用包含全面的THISP (Human Integrated search Proteome)4級數據庫和7,264個由Ribo-seq檢測并由GENCODE支持的ncORF來構建了數據庫。
圖1.參與注釋工作的中心概述和肽圖譜框架。
分析顯示,在7,264個ncORF中,至少有25%產生了翻譯基因產物,在泛蛋白質組分析中產生了超過3,000個肽,包含來自95,520個實驗的38億個MS/MS譜。利用這些數據,研究團隊開發了一個ncORF的注釋框架,并通過GENCODE和PeptideAtlas創建了公共工具,為在生物醫學中推進發現ncORF衍生蛋白提供一個平臺。在搜索了來自人類細胞系、組織和液體的普通蛋白酶消化以及免疫肽組學數據集的38億個MS/MS譜后,研究團隊手動驗證了1,715個ncORF的證據,證明它們具有蛋白質組學翻譯的令人信服的證據,值得進一步探索。
圖2.由非HLA或HLA數據檢測到的兩個ncorf的例子。
斯坦福大學遺傳學家Ami Bhatt認為,新發現的微小蛋白質能夠幫助提供人類基因組編碼部分的更完整圖譜,其研究團隊已經在探索微生物的黑暗蛋白質組。
事實上,在早期研究中,許多科學家認為這些微小蛋白質不重要,認為它們是很快降解的“噪音”。3年前,Prensner及合作者證明癌細胞含有大約550種微小蛋白質。2年前,公主Máxima兒科腫瘤學中心的系統生物學家Sebastiaan van Heesch在心臟組織中發現了類似數量的微小蛋白質。基于一系列研究發現,Prensner和van Heesch開始與GENCODE基因注釋專家Jonathan Mudge合作,從來自世界各地的20個機構招募了幾十名研究人員來共同評估人類存在的ncORF。
此次發表的研究成果也為科學家提供了新的生物醫學研究目標。研究團隊已經開始對早期暗蛋白質組研究中發現的ncORF及其微小蛋白質進行后續研究。通過使用基因編輯器CRISPR在ncORF中引入突變,可以檢測其蛋白質在癌細胞中的重要性。例如,研究發現ncORF蛋白雖然很小,但對髓母細胞瘤的存活至關重要。
研究團隊認為:“我們可能為病人找到了一種全新的藥物靶點。這種微小蛋白質并沒有出現在人類基因組的原始分析中,但“它在成神經管細胞瘤中起著關鍵作用。”
Prensner還為ProFound Therapeutics公司提供咨詢服務,該公司與制藥巨頭輝瑞正合作開發基于微蛋白靶點的肥胖治療方法。文章作者、加州大學歐文分校的蛋白質生物化學家Thomas Martinez團隊正在尋找與胰腺癌和代謝性疾病有關的微小蛋白質。Martinez表示:“我最興奮的是將微蛋白轉化為治療手段,希望它既是生物標志物,也是藥物靶點。一旦跨越了這個障礙,我認為人們對該領域的興趣將會大大增加。”
參考資料:
1.High-quality peptide evidence for annotating non-canonical open reading frames as human proteins
https://www.biorxiv.org/content/10.1101/2024.09.09.612016v1
2.https://www.science.org/content/article/dark-proteome-survey-reveals-thousands-new-human-genes
快點亮"在看”吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.