在癌癥的復(fù)雜基因組中,結(jié)構(gòu)變異(SVs)和拷貝數(shù)變異(SCNAs)是驅(qū)動腫瘤演化的核心力量。傳統(tǒng)的短讀測序技術(shù)(如 Illumina 平臺)受限于讀長,難以解析重復(fù)序列或復(fù)雜重排區(qū)域的變異,導(dǎo)致大量關(guān)鍵信息被遺漏。
長讀測序技術(shù)雖能讀取長達(dá)兆堿基的 DNA 片段,但其早期高成本、低通量和高誤差率的問題,限制了在癌癥研究中的應(yīng)用。
為突破這一困局,歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的研究團(tuán)隊(duì)開發(fā)了 SAVANA 算法,目標(biāo)是利用長讀測序數(shù)據(jù),實(shí)現(xiàn)體細(xì)胞變異的高靈敏度與高特異性檢測,同時(shí)推斷腫瘤純度和倍性。
該研究以「SAVANA: reliable analysis of somatic structural variants and copy number aberrations using long-read sequencing」為題,于 2025 年 5 月 28 日刊登于《Nature Methods》。
論文鏈接:https://www.nature.com/articles/s41592-025-02708-0
SAVANA 始于對測序數(shù)據(jù)的深度「理解」,算法通過 70 余個(gè)特征(如斷點(diǎn)位置、支持讀長、覆蓋深度等)刻畫每個(gè)候選變異,借助隨機(jī)森林(RF)機(jī)器學(xué)習(xí)模型,SAVANA 能有效區(qū)分真實(shí)變異與測序噪音。
在訓(xùn)練數(shù)據(jù)中,模型通過對比 99 對腫瘤-正常樣本的長讀與短讀數(shù)據(jù),其受試者操作特征曲線下平均面積高達(dá) 0.98,展現(xiàn)出驚人的判別能力。
圖 1:SAVANA 概述。
針對癌細(xì)胞常存在的復(fù)雜單倍型特異性變異,SAVANA 支持對 phased 測序數(shù)據(jù)的分析,這意味著算法不僅能識別變異的存在,還能追蹤其在染色體拷貝中的傳遞路徑,在膠質(zhì)母細(xì)胞瘤樣本中,SAVANA 成功區(qū)分了同一基因在不同單倍型上的擴(kuò)增事件。
除了變異檢測,SAVANA 還能整合讀深度和 B 等位基因頻率(BAF)數(shù)據(jù),推斷腫瘤純度(腫瘤細(xì)胞占比)和倍性(染色體拷貝數(shù)異常)。
通過分析雜合SNP在純合缺失區(qū)域的偏移,算法可精準(zhǔn)計(jì)算正常細(xì)胞污染程度,其結(jié)果與短讀測序分析高度吻合(皮爾遜相關(guān)系數(shù) 0.97)。
在 99 例臨床樣本(涵蓋軟組織肉瘤、骨肉瘤、膠質(zhì)母細(xì)胞瘤)的分析中,SAVANA 展現(xiàn)了強(qiáng)大的臨床轉(zhuǎn)化潛力。檢測到的變異中,86% 與長讀長數(shù)據(jù)結(jié)果一致。
圖 2:用于 SV 和 SCNA 分析的短讀長數(shù)據(jù)比較。
在骨肉瘤這一好發(fā)于青少年的惡性腫瘤中,SAVANA 成功解析了傳統(tǒng)技術(shù)難以識別的復(fù)雜重排。
當(dāng)研究團(tuán)隊(duì)將 SAVANA 的長讀數(shù)據(jù)結(jié)果與 Illumina 短讀測序?qū)Ρ葧r(shí),兩者在變異檢測上高度一致。這意味著 SAVANA 不僅看得更深,還能與現(xiàn)有臨床標(biāo)準(zhǔn)兼容。
在黑色素瘤細(xì)胞系 COLO829 的驗(yàn)證中,SAVANA 對 68 個(gè)體細(xì)胞 SV 的真值集進(jìn)行檢測,經(jīng)由 PCR 驗(yàn)證變異的召回率顯著高于其他算法。
在正常樣本對比實(shí)驗(yàn)中,SAVANA 僅產(chǎn)生 5 個(gè)假陽性 SV,而 Sniffles2 和 cuteSV 分別高達(dá) 1940 和 2737 個(gè),特異性分別為后者的 388 倍和 547 倍。
隨著英國等國家將 SAVANA 納入臨床基因組學(xué)戰(zhàn)略,長讀測序的「臨床化」進(jìn)程正在加速。盡管仍需優(yōu)化計(jì)算成本和通量,但其在復(fù)雜變異解析、腫瘤異質(zhì)性追蹤和跨族群醫(yī)療公平性中的潛力已毋庸置疑。
SAVANA 的誕生也暗示著長讀測序在癌癥研究中的成熟,其臨床應(yīng)用不僅是技術(shù)的突破,更是醫(yī)療理念的進(jìn)一步發(fā)展。在遵循數(shù)據(jù)隱私法規(guī)的同時(shí),SAVANA 將會為精準(zhǔn)醫(yī)療帶來更加明確的治療方向。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.