近期,英國牛津大學(xué)團(tuán)隊(duì)連續(xù)開發(fā)出兩項(xiàng)互補(bǔ)的測(cè)序糾錯(cuò)系列技術(shù),“同源三聚體標(biāo)記”(測(cè)序后糾錯(cuò))和“錨固增強(qiáng)”(測(cè)序前糾錯(cuò))技術(shù),分別從分子標(biāo)記設(shè)計(jì)和合成源頭兩個(gè)層面出發(fā),協(xié)同提升單細(xì)胞長讀長測(cè)序的準(zhǔn)確性。
通過擴(kuò)增核苷酸三倍,課題組設(shè)計(jì)了同源三聚體分子標(biāo)記,并開發(fā)了實(shí)驗(yàn)和計(jì)算分析流程。
研究人員從密碼學(xué)汲取靈感,提出了一套適用于同源三聚體分子標(biāo)記的研究體系:
1. 實(shí)驗(yàn)和計(jì)算分析版本(即本次受訪內(nèi)容);
2. 計(jì)算工具和平臺(tái)(UMIche,目前在審稿中),提供了關(guān)鍵性的測(cè)序性能分析和驗(yàn)證指標(biāo);
3. 理論推導(dǎo)(預(yù)印版)[3]。
目前,同源三聚體標(biāo)記已發(fā)展成為相對(duì)較全地具有上下游分析配合的測(cè)序技術(shù)方案。
在論文投稿過程中,業(yè)內(nèi)專家點(diǎn)評(píng)稱在單細(xì)胞長讀長測(cè)序和體細(xì)胞變異檢測(cè)中,這項(xiàng)技術(shù)將會(huì)大有可為。并認(rèn)為該團(tuán)隊(duì)使用“通用分子標(biāo)記,CMI”在實(shí)驗(yàn)端做驗(yàn)證的策略,是一種巧妙的點(diǎn)子(ingenious idea)。其還指出在目前的論文中,課題組所提供的糾錯(cuò)場(chǎng)景可能局限了這一方法的潛力,事實(shí)上它能被用于更加復(fù)雜的糾錯(cuò)場(chǎng)景中,例如插入和缺失錯(cuò)誤。
基于這一技術(shù),該團(tuán)隊(duì)創(chuàng)辦了一家名為 Entelo Bio(前身為 Caeruleus Genomics)的生物科技公司,希望能夠革新已有的測(cè)序技術(shù)。
目前,本次成果依舊存在生產(chǎn)成本高以及合成偶聯(lián)率低等局限,這讓同源三聚體的量產(chǎn)依舊面臨著不少挑戰(zhàn)。
因此,研究人員正在攜手業(yè)界合作方,探索實(shí)現(xiàn)量產(chǎn)的可能性。
在計(jì)算上和實(shí)驗(yàn)上,本次技術(shù)的先進(jìn)性均得到了驗(yàn)證。假如可以實(shí)現(xiàn)量產(chǎn),它能快速、精確地檢出腫瘤生物標(biāo)志物,也能通過催化方法找到新的藥物分子,并優(yōu)化其結(jié)構(gòu)的速度,并能成為業(yè)界一個(gè)重要且獨(dú)立的商業(yè)運(yùn)行單元。
據(jù)介紹,測(cè)序技術(shù)對(duì)于理解復(fù)雜的生命科學(xué)現(xiàn)象以及闡釋疾病致病機(jī)理是一種重要手段。
測(cè)序時(shí),通常使用一個(gè)名為“分子唯一標(biāo)記碼”的序列,來標(biāo)記待測(cè)物的身份。
但是,這段序列是隨機(jī)合成,并且也會(huì)出現(xiàn)測(cè)錯(cuò)的情況,所以在測(cè)序之后的糾錯(cuò)就會(huì)變得非常困難。
而本次研究的開展始于一項(xiàng)臨時(shí)實(shí)驗(yàn)的提議。德國慕尼黑工業(yè)大學(xué)博士、英國牛津大學(xué)博士后孫鑒鋒,是本次論文的第一作者。
當(dāng)他剛到牛津大學(xué)報(bào)道的第一天,合作教授亞當(dāng)·克里布斯(Adam P. Cribbs)剛好于同一天刊發(fā)了一篇關(guān)于第三代測(cè)序糾錯(cuò)技術(shù)(scCOLOR-seq)的論文。于是,兩人的不少談話內(nèi)容都涉及到了測(cè)序糾錯(cuò)這一話題。
當(dāng)天,克里布斯教授在身旁的白板上比劃了幾下,寫下幾個(gè)二重和三重同源核苷酸字符,并對(duì)孫鑒鋒說:“我對(duì)量子計(jì)算很感興趣,但是我沒有相關(guān)的理論和計(jì)算背景,這個(gè)項(xiàng)目難度未知,但我覺得實(shí)驗(yàn)上大體可行,數(shù)理計(jì)算是你的專長,你也許可以做出一番不一樣的工作來,要不要試試?”
密碼學(xué)和信息論算是孫鑒鋒本科期間重點(diǎn)專業(yè)課之一,他立刻意識(shí)到克里布斯教授模棱兩可的地方正是著名加密方法“三重冗余模塊”算法擴(kuò)展到非二元系統(tǒng)的應(yīng)用問題,因此他覺得“可以動(dòng)工”。
彼時(shí),著名的牛津納米孔測(cè)序技術(shù)還沒有迭代到最新版本,平均錯(cuò)誤率依舊高達(dá) 15% 左右,在特定情形下錯(cuò)誤率甚至?xí)该图ぴ觥?/p>
因此,要想在這么高的錯(cuò)誤率之下進(jìn)行糾錯(cuò),并能實(shí)現(xiàn)精準(zhǔn)測(cè)序著實(shí)讓人望而卻步,在該團(tuán)隊(duì)眼中必須得有“妙手回春”的技術(shù)才行。
通過開發(fā)和驗(yàn)證完整的實(shí)驗(yàn)和計(jì)算方法,他們最終有效提升了測(cè)序技術(shù)的精度。
該系列研究的第一項(xiàng)成果“同源三聚體標(biāo)記”技術(shù)的相關(guān)論文以《糾正唯一分子標(biāo)識(shí)符中的 PCR 擴(kuò)增錯(cuò)誤,以生成準(zhǔn)確數(shù)量的測(cè)序分子》(Correcting PCR amplification errors in unique molecular identifiers to generate accurate numbers of sequencing molecules)為題發(fā)在Nature Methods[1]。
圖 | 相關(guān)論文(來源:Nature Methods)
孫鑒鋒是第一作者,牛津大學(xué)教授亞當(dāng)·克里布斯(Adam P. Cribbs)擔(dān)任通訊作者。
圖 | 孫鑒鋒(來源:孫鑒鋒)
在論文被預(yù)接收之時(shí),Nature Methods編輯團(tuán)隊(duì)表示,打算邀請(qǐng)第三方專家為本次研究額外撰寫一個(gè)評(píng)論并發(fā)表在Nature Methods上。
在那篇評(píng)論文章中,由一名 RNA 測(cè)序精度方面的頂尖專家之一對(duì)本次論文做了簡(jiǎn)評(píng)。
“其實(shí),在更早之前的審稿階段,他就對(duì)我們的成果持積極態(tài)度。”研究人員表示。另一位業(yè)內(nèi)同行則評(píng)論稱:“該技術(shù)理論層面的可靠性,在其他領(lǐng)域中也已經(jīng)得到了驗(yàn)證和支持”。
研究人員表示,當(dāng)采用逆轉(zhuǎn)錄來合成 RNA 序列的時(shí)候,會(huì)引入一些錯(cuò)誤,而本次測(cè)序技術(shù)解決了這一問題。
在“同源三聚體標(biāo)記”技術(shù)發(fā)表之后,課題組又討論了這樣一個(gè)問題:難道測(cè)序之后的序列錯(cuò)誤,僅僅是在測(cè)序過程中引入的嗎?假如在對(duì)唯一分子標(biāo)識(shí)符進(jìn)行測(cè)序之前出現(xiàn)問題了怎么辦?
這個(gè)問題的產(chǎn)生源自于該研究團(tuán)隊(duì)在一次單細(xì)胞測(cè)序?qū)嶒?yàn)后對(duì)文庫中分子數(shù)量的異常檢測(cè):他們觀察到細(xì)胞條形碼的多樣性增多,而分子標(biāo)記(又稱分子條形碼)的多樣性減少。于是,他們懷疑測(cè)序文庫的污染可能跟序列的異常截短或是縮進(jìn)有關(guān)。
針對(duì)這一問題,該團(tuán)隊(duì)又開展了新的研究,借此發(fā)現(xiàn)在測(cè)序之前:由于微珠上多聚核苷酸 T 的縮進(jìn)從而導(dǎo)致分子標(biāo)記被截短,使得微珠上整條序列合成出現(xiàn)問題。
針對(duì)此,他們提出一種名為“錨固增強(qiáng)”的技術(shù),將一段由 4 個(gè)核苷酸組成的固定序列置于細(xì)胞條形碼和分子標(biāo)記之間,從而有效識(shí)別分子標(biāo)記起始位置。
這個(gè)設(shè)計(jì)方案能夠偵測(cè)到比以往更多的 RNA 分子量,為難以偵測(cè)到罕見病致病基因的問題提供了新的思路和機(jī)遇。
該系列研究的第二項(xiàng)成果“錨固增強(qiáng)”技術(shù)的相關(guān)論文以《利用插入式錨固寡核苷酸序列提升單細(xì)胞轉(zhuǎn)錄組學(xué)分析》(Enhancing single-cell transcriptomics using interposed anchor oligonucleotide sequences)為題發(fā)在Communications Biology[2]。
圖 | 相關(guān)論文(來源:Communications Biology)
在后續(xù)計(jì)劃上:
一方面,鑒于本次技術(shù)的可靠性已經(jīng)得到驗(yàn)證,但是距離批量化生產(chǎn)和應(yīng)用還有一定距離,因此他們將嘗試增強(qiáng)合成同源三聚體的效率,以及優(yōu)化其在微珠的附著效率,同時(shí)也會(huì)尋找更多合適的業(yè)界合作伙伴。
另一方面,盡管研究團(tuán)隊(duì)已經(jīng)開展過多種計(jì)算分析,但是目前領(lǐng)域內(nèi)依舊沒有系統(tǒng)化的計(jì)算分析方法和平臺(tái)。所以,他們會(huì)持續(xù)開發(fā)新的計(jì)算應(yīng)用方法。
如果以上兩項(xiàng)計(jì)劃都能實(shí)現(xiàn),這兩項(xiàng)分別用于測(cè)序前和測(cè)序后糾錯(cuò)的系列技術(shù)將有望在揭示罕見病致病機(jī)理上進(jìn)行協(xié)同貢獻(xiàn),也有望在已有的疾病知識(shí)體系之下挖出新的知識(shí)。
參考資料:
1. Sun, J., Philpott, M., Loi, D. et al. Correcting PCR amplification errors in unique molecular identifiers to generate accurate numbers of sequencing molecules.Nat Methods21, 401–405 (2024). https://doi.org/10.1038/s41592-024-02168-y
2. Sun, J., Philpott, M., Loi, D. et al. Enhancing single-cell transcriptomics using interposed anchor oligonucleotide sequences.Commun Biol8, 67 (2025). https://doi.org/10.1038/s42003-025-07474-5
3.https://www.researchsquare.com/article/rs-6710367
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.