在循證醫學時代,醫療決策的科學性和可靠性高度依賴于健全的證據生態系統。這一系統涵蓋了從原始研究到系統評價,再到臨床指南的整個鏈條。然而,近年來,學術不端行為導致的論文撤稿事件頻發,這無疑給醫療證據的可信度蒙上了陰影。研究撤稿試驗對醫療證據生態系統的影響具有重要的現實意義。
2025年4月23日,《BMJ》(IF=93.6)發表了一項大規模實證研究,揭示撤稿試驗如何在證據合成、臨床指南以及循證醫學實踐中引發“污染鏈”。
原文鏈接:https://www.bmj.com/content/389/bmj-2024-082068
研究方法
研究流程
研究者從Retraction Watch數據庫中檢索了一批被撤稿的隨機對照試驗(RCTs),檢索時間截至2024年11月5日。然后,使用前向引用檢索*來確定包含這些撤稿試驗的系統評價和meta分析。研究者在排除撤稿試驗后重新分析了數據,以量化撤稿試驗對系統評價和meta分析結果的影響。最后,研究者通過全面的文獻檢索來確定可能會受到影響的相關臨床指南。
注:*前向引用(即被引用)指的是某項研究被后續研究引用。
數據來源
研究數據由3部分構成:撤稿試驗、包含撤稿試驗的證據綜合研究以及使用受污染證據的臨床指南。
主要數據來源:從Retraction Watch數據庫中檢索標記為“Clinical Study”和“Research Article”的撤稿記錄,限制在健康科學領域。檢索截止日期為2024年11月5日。兩名研究者獨立審查撤稿試驗的標題和摘要,隨后進行全文審查,以確認其是否為符合標準的RCTs。
補充數據來源:通過Google Scholar和Scopus進行前向引用檢索,以識別包含撤稿試驗的系統評價和meta分析。通過關鍵詞篩選和全文審查,確定哪些系統評價進行了定量證據合成。
對于那些結論因撤稿試驗而受到歪曲的系統評價,通過Scopus、Google Scholar以及相關數據庫(如Guidelines International Network [GIN]和TRIP數據庫)進行文獻檢索,識別可能受影響的臨床指南。
撤稿試驗選擇標準
納入標準:被撤稿的人類RCTs,不限制撤稿原因。
排除標準:非隨機對照試驗、未在人類中進行的試驗、非英文發表的試驗等。
Meta分析的復現與更新
三名證據合成方法學家獨立對包含撤稿試驗的meta分析進行了復現,首先使用原始數據和方法復現結果,然后排除撤稿試驗后重新分析數據。隨后,在排除撤稿試驗后,評估對meta分析結果的影響,包括效應量的方向、統計顯著性以及效應量大小的變化。
結局
主要結局:根據復現結果,評估撤稿試驗對效應值和方向的影響,以及P值的顯著性。
次要結局:評估受撤稿試驗嚴重影響的證據評價,這些證據評價可能會污染臨床指南。“受到重大影響”定義為:同時改變了效應值方向和P值顯著性的試驗,或者改變了效應值方向而P值仍然顯著的試驗。
研究結果
研究者從Retraction Watch數據庫中檢索到12,542條記錄,最終納入1330項撤稿試驗、847項系統評價和meta分析。
圖. 撤稿試驗的選擇流程圖
撤稿試驗的特征
(1)中位撤稿時間為試驗發表后的21.3個月(四分位距[IQR] 12.1-89.8)。
(2)249項(18.7%)試驗有注冊信息,34項(2.6%)由行業資助。
(3)36.4%(n=484)為單中心試驗,11.0%(n=146)為多中心試驗,52.6%(n=700)未報告相關信息。
(4)僅27.8%的撤稿試驗在數據共享聲明中明確聲明了數據可用。
(5)大多數撤稿(85.0%;n=1131)由期刊發起,僅9.2%(n=123)由作者發起。
(6)70.8%(n=942)的撤稿原因涉及數據相關問題,12.9%(n=172)被標記為來自論文工廠。
撤稿試驗對證據的影響
在排除撤稿試驗后,8.4%(95%CI 6.8%-10.1%)的meta分析方向改變,16.0%(14.2%-17.9%)的meta分析P值顯著性發生改變,3.9%(2.5%-5.2%)的meta分析方向和顯著性均改變,15.7%(13.5%-17.9%)的meta分析效應量大小變化超過50%。
圖. 撤稿試驗對證據的影響
撤稿試驗對臨床指南的影響
68項系統評價的結論因撤稿試驗而受到歪曲,這些系統評價被用于157項指南或聲明。
類型包括:
o臨床指南:89項(57%)
o共識聲明:42項(27%)
o立場聲明:12項(8%)
o實踐公告:9項(6%)
o委員會意見:5項(3%)
證據污染鏈
為闡明撤稿試驗如何影響證據生態系統,研究者構建了一個簡化的證據污染鏈,如下圖所示:
圖. 撤稿試驗的證據污染鏈
在4條潛在的污染途徑中,從撤稿試驗到證據綜合研究再到臨床指南的路徑最為關鍵。通過前向引用檢索進行定量分析發現:在1330項撤稿試驗中,有312項(23.5%)試驗污染了來自847篇系統評價的4095項meta分析,其中受到實質性影響的218項meta分析(來自68篇系統評價)被進一步引用至157份英文指南。這意味著平均每篇撤稿試驗會污染3篇系統評價中的13項meta分析,而每篇受污染的系統評價又會進一步影響至少3份臨床指南。
總結與討論
本研究通過大規模實證調查,評估了撤稿試驗對醫療證據生態系統的影響。結果表明,平均每項撤稿試驗可能“污染”約3項系統評價,而每項被污染的系統評價又可能進一步影響至少3項臨床實踐指南。
在納入撤稿試驗的meta分析中,排除撤稿試驗后,8.4%的meta分析效應量方向發生改變,15.7%的效應量大小變化超過50%,16.0%的P值顯著性發生改變。這些變化可能導致完全不同的結論。
這是在證據生態系統中建立撤稿試驗“污染鏈”的首次嘗試。研究的優勢在于:通過全面檢索獲得具有廣泛代表性的樣本,并對每項meta分析進行細致復核,這些嚴謹方法顯著增強了研究結果的可信度。此外,研究采用嚴格的數據收集與分析流程,有力保障了研究結果的可靠性。
局限性包括:(1)研究未納入患者或公眾代表,這可能對后續成果傳播產生不利影響;(2)基于四大文獻數據庫的檢索可能遺漏部分臨床指南;(3)研究僅關注成對meta分析,撤稿試驗對網狀meta分析結果的影響及其對相關臨床指南的后續傳導效應仍需進一步探究;(4)無法確保已識別所有被系統評價納入的撤稿試驗;(5)研究僅聚焦撤稿的隨機試驗,而部分非隨機干預研究若被撤稿同樣會造成證據污染。
參考文獻:BMJ.2025;389:e082068.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.