點擊藍字關注,多點在看防失聯
個人觀點,不代表任何組織與單位
一個刷屏科研圈的新聞:NIH突然禁止中國研究人員使用核心數據庫。
起因是NIH在4月2日發表的一份公告,通知從4月4日起,禁止6個國家訪問NIH的受控數據庫(controlled-access data repositories)。
幾個需要注意的點——也是網上不少說辭有混淆的地方。
第一,限制中國在內數個國家地區對NIH部分數據庫的訪問是過去一年多美國法律推進的結果,很難說“突然”。
NIH通告里引用了兩條法規,一條是2024年2月頒布的行政令EO14117,這是拜登政府發布的限制一些國家獲取美國個人敏感信息以及美國政府信息的行政令。該行政令提出個人基因組信息在內的一些生物學數據屬于敏感信息,源于美國境內的數據不能傳到包括中國在內的部分國家。
另一條被引用的 28 CFR Part 202,是美國司法部依據 EO14117做出的最終法規。 EO14117和 28 CFR Part 202是典型的美國立法方式,行政令或國會立法給出框架,相關部門,比如這里的美國司法部根據框架再確立具體條規。
28 CFR Part 202是美國司法部基于 EO14117給出的最終法規,公布時間是2024年12月27日,生效時間是2025年4月8日,里面給出了諸如多少數量的個人基因組數據屬于大量等具體規則。
NIH 4月2日通告限制中國等地訪問部分NIH管理的數據庫,是執行司法部的 28 CFR Part 202,從 EO14117算起,整個事件演變超過一年,并非突然。
第二,受限的是NIH部分數據庫,很多常用的NIH數據服務不受影響。
說到有NIH數據庫不能用,很多人第一反應是文獻數據庫pubmed這類生物醫學最常用的數據庫不能用了,但這屬于誤解。
NIH通告里明確說了受限制的是受控數據庫(controlled-access data repositories)。
NIH數據庫可以分為兩個類型,一個就是受控數據庫,另一類是開放數據庫(open access)。前者由于具有個人基因組信息、醫療信息等敏感內容,使用本就有規則,需要注冊,獲的授權后才能訪問。而大家熟知的pubmed是開放數據庫,并非受控數據庫,不受NIH新規定影響。
NIH網站上有列出21個受控數據庫:
這些受控數據庫涉及 EO14117和 28 CFR Part 202提到的個人基因組信息等敏感信息。NIH針對中國等國家的限制,等于是在受控數據庫訪問的規則里加入里地理限制,中國等地的研究人員不能取得相關訪問權限。
第三,一些NIH數據庫有“受控”與“公開”兩個分級,受影響的是前者,不影響“公開”級別數據的使用。
我們以實例說明被限制的“受控”到底是怎么回事。
從上表可見NIH列出的多個受控數據庫都屬于dbGaP Access System。該系統全名是 The database of Genotypes and Phenotypes,是存儲基因型與表型數據的平臺。
美國國立癌癥研究所(NCI)有一個針對癌癥研究的基因組數據庫:癌癥基因組學數據共享中心(Genomic Data Commons,簡稱GDC)。做腫瘤研究經常遇到的數據庫TCGA就是GDC的一部分,而GDC又建立在 dbGaP之上。
TCGA數據有兩個層級,一個是“公開”(open access),任何人打開TCGA都可使用,不需要獲取特殊許可。該“公開”層級的特點是不具備可追溯到個人的信息。舉個例子,你可以用TCGA看EGFR突變這種致癌突變在不同腫瘤類型里的比例。
但TCGA也能提供更細致的信息,比如某份腫瘤樣本的原始測序數據,這就屬于“受控數據”,必須取得GDC的受控數據訪問權限方能獲得,GDC網站上也有取得權限的流程示意圖:
“受控數據”需要權限顯然有重要的隱私保護考慮,畢竟這些數據更容易追溯到具體個人。
但EO14117和 28 CFR Part 202加入的是國家安全要求,認為此類數據如果傳輸到部分國家,不僅威脅到隱私,還有國家安全問題。NIH基于此執行的新規,也就意味著中國等地的研究人員無法獲得相應訪問、使用權限。
了解了這些,我們也能推測,NIH此次禁止中國研究人員使用部分數據庫,受影響最大的是那些此前注冊了相關訪問權限,深度使用這些受控數據庫的科研工作人員。如果此前從未尋求過那些受控數據庫的使用權限,受到的影響有限。
考慮到近年來歐美出于隱私、國家安全等多個因素,對基因組等敏感數據的管控越來越嚴,依賴歐美“受控”級別的基因組、醫學數據做研究,本來也過于冒險。
網上對某些數據庫的重要性描述似乎也令人難以理解。比如SEER,這是美國本土的癌癥流行病學數據庫,包括美國這里的各種腫瘤發生率、預后情況。作為目前全球最大、最全的腫瘤流行病學數據庫,中國的研究人員想參考其中數據做研究可以理解,可這畢竟是在美國收集到的患者數據,不同腫瘤的發病率、標準治療方案等均可能與中國本土數據相去甚遠。
如果一項在中國的研究離開SEER就無法實行,那么這項研究到底是在琢磨什么?又有多大必要非在中國做呢?
訂閱關注防失聯
前沿醫藥,請關注
參考資料
https://grants.nih.gov/grants/guide/notice-files/NOT-OD-25-083.html
更多精彩內容見Youtube:Y博的科普園
Y博也有播客了,歡迎關注《說醫解藥》
小宇宙、蘋果播客、Spotify同步更新
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.