近日,首都醫科大學宣武醫院的頸動脈支架手術數據集(登記時包含2550條數據)在北京國際大數據交易所(后簡稱:北數所)進行了資產確權登記,同時完成交易。
這是北京市史上第一筆公立醫院健康數據交易,交易由北數所牽頭,宣武醫院供應數據資產,盈理律師事務所負責數據交易涉及的法律服務。
據宣武醫院表示:該交易數據經過嚴格的匿名化、數據清洗、整合和標準化處理,嚴格保護患者隱私,確保了數據的準確性和可用性。未來,該數據集將應用于國產頸動脈支架產品的研發,助力醫療機構更加精準地理解中國人群的腦血管疾病。
首都醫科大學宣武醫院數據資產登記憑證
早年數字醫療的風吹起時,醫療數據隱藏的巨大價值便已為眾人津津樂道,但囿于數據規范、數據互聯互通、數據安全、數據開放、數據共享等問題無力解決。理論上價值千億規模的市場,實際之中鮮有旁觀者垂目。
本次交易的完成,似乎讓這一切有了一個答案——過去“不敢共享、不愿共享”的門檻已經跨過,一個健康數據自由流通的時代已經來臨。
01
公開記錄中的首筆健康數據場內交易
在宣武醫院數據交易完成前,我國的健康數據交易市場自2023年下半年開始已經頗有起色。
2023年8月,山東健康醫療大數據管理中心與國家健康醫療大數據中心(北方)共建單位在數據交易流通方面先行先試,憑借《人群流行病學分析報告》獲得全國健康醫療數據產品首張場內交易憑證,并在同月月末成功完成首筆數據產品場內交易。
而后半年時間,福建大數據交易所亦實現“零的突破”,依靠《廈門市內分泌代謝疾病分析報告》拿下福建省內首單健康醫療數據產品場內交易。
不過,上述兩筆數據交易的本質均是基于健康數據的報告交易,買方買到的是基于健康數據生成的結果,而非健康數據使用權本身。直至2024年5月,廣東省人民醫院在完成健康醫療數據的匯聚、治理、管理的基礎上,經數據匿名化處理及安全加密后、形成“廣東省醫學科學院糖尿病視網膜病變診斷數據產品”“廣東省醫學科學院心臟疾病診斷預測數據產品”2項健康醫療數據產品,終才正式支持以數據集為標的的健康數據交易。
2024年10月,上海第一人民醫院再度實現突破,一天之內申請到了18張數據產品掛牌證書,其中包含AI輔助診斷中常用到的肺結節、糖網病變、CT-FFR、乳腺超聲等多模態數據集,亦有精子發生障礙、急性白血病基因突變與移植預后等專病數據集。部分數據集的數據維度達到了512項,存儲大小高達100 TB。
各數據交易所上架數據集統計(非完全統計)
與上述事件相比,宣武醫院交易一事有其特有的積極意義。一方面,查閱公開資料可見,宣武醫院交易前只有掛牌,沒有公開報道的場內交易(可能存在圍繞科研機構展開的場外交易),此次交易可謂開啟了健康數據場內交易的先河。
另一方面,本次交易較于過往國內公開的已完成的健康數據交易有兩大不同之處。
其一,過往完成的健康數據交易形式通常為售賣基于醫療數據生成的定向報告,買方并不直接接觸數據。而本次數據交易標的為醫療數據本身,這意味著買方有權通過協議約定對購置的脫敏醫療數據進行自主訓練、分析。
其二,過往數據資產登記憑證的更新頻率較慢,許多資產更新時間長達一年,而宣武醫院將對數據集進行每周一次的更新。當買方在實際應用中發現數據量不足時,高頻率的更新將為其提供拓展數據集的可能,且能推進交易雙方后續數據交易的進行。
如宣武醫院所言,它邁出了數據驅動醫療創新、推動高質量發展的嶄新一步,開啟了通過數據流通服務健康中國的全新模式,為全國醫療健康數據的合規應用樹立了新的標桿。
02
橫亙在健康數據交易面前的三大難題
到目前為止,各大交易所的健康數據產品大致可分為4類:一是語料數據,二是可直接使用的平臺&AI模型,三是基于健康數據的分析報告,四是特定設備&專病健康數據集。四大產品類型理論上已能滿足市面上絕大多數健康數據需求,理想條件下的健康數據交易模型,已初步成型。
只是,在將理想模型變為現實的過程中,健康數據交易市場還有不少系統性的問題有待解決。
盡管宣武醫院交易一事為行業帶來了顛覆性的意義,但健康數據交易市場還有不少系統性的問題有待解決。
北京瀛和(廣州)律師事務所高級顧問黃迪律師正在參與廣東省關于健康醫療數據資產合規登記的地方標準的起草制定,她認為:互聯網、金融等行業數字化程度高,形成高質量數據資源的基礎條件好,二是這些行業本身需要數據支撐的商業模式和應用場景多,譬如電商平臺通過分析用戶的瀏覽歷史、購買行為等數據,將這些數據進行交易或共享,以實現廣告投放的精準匹配,提高廣告轉化率;金融行業則長期利用數據來建立風險評估模型、信用評級模型等,精準評估各類信貸的風險。
相較之下,健康醫療數據在進行市場化應用時,由于涉及大量個人隱私和敏感信息,需要通過技術手段和合規體系確?;颊邆€人信息權益的前提下,在高效釋放數據要素價值與保護患者隱私之間找到平衡點。
其一,健康數據權屬復雜,往往具備個人數據與公共數據的雙重屬性,所涉數據權利主體多樣化,即患者、醫療機構、醫療行業主管部門、醫療儀器設備廠商都可能是健康醫療數據的持有者或控制者,如何通過合規體系和確權體系解決這些數據權屬是市場化應用的前提。
其二,由于健康數據缺乏統一定價標準,定價困難,現階段市場主要是通過交易雙方協商定價。數據提供方會根據數據的質量、稀缺性、用途等因素綜合評估一個價格區間,數據購買方則會根據自身的需求和預算進行談判。
最后,各醫療機構的健康醫療數據格式和標準不統一,形成高質量數據資源的整合技術難度相對較大。此外,許多醫院無法提供高頻的數據集更新服務,致使數據需求方的購置成本居高不下,且很難對數據集的容量進行擴充。
目前解決上述問題的方式主要有兩種路徑,一是結合海外經驗,逐一解決上述問題。譬如在權屬方面,美國依據《著作權法》對具有版權或相關權利的公共數據庫,采取知識共享 COO 許可,開放數據庫許可等方式,授權用戶用以商業或非商業目的開發利用。英國依照《政府許可框架》《自由保護法案》等,對受版權或數據庫權利保護的數據采用開放政府許可,允許用于商業或非商業的免費復制、發布、分發、傳輸及改編數據:針對超過《公共部門信息再利用條例》規定范圍的數據再利用設置收費許可。
另一方面,我國也在不斷完善相關文件。2023 年 9 月,中國資產評估協會便曾印發《數據資產評估指導意見》結合收益法、成本法和市場法等評估方法,以及影響數據質量的因素如準確性、一致性、完整性等,評估數據資產的價值并為交易定價提供一定的依據。
理想條件下的健康數據交易模型
03
孤掌難鳴,健康數據價值涌現還需更多機構入局
盡管數據交易仍然存在重重阻礙,但從更長遠的角度來看,醫療機構、企業、交易所、監管機構均有動力將健康教育深入地推動下去。
對于醫院而言,政策指導下的醫療IT建設雖能在長期之中提升醫院的綜合競爭力,但短期之內僅以成本的形式計入損益表中。因此,盡管各類政策在后不斷助推,仍有不少醫院不愿在醫療信息化建設之中投入太多精力。
健康數據交易的實現或能改變這一局面。通過規?;N售脫敏數據,醫院可以將數據治理從成本轉化為收入,從而激發其主動深化信息化建設的動力。
對于AI和信息化企業來說,健康數據交易同樣帶來了積極影響。以往,這些企業在基于臨床數據進行應用研發時,往往受限于有限數量醫院的合作,可能導致算法運行時出現地域性,難以廣泛應用。
健康數據交易成規模后,這些企業有望擺脫對于醫院的依賴,在研發之初便綜合多家醫院的數據,制造魯棒性更強的人工智能。此外,新的模式還能使他們在銷售人工智能產品時更加獨立,避免了潛在的知識產權糾紛。
問題在于:現階段的健康數據交易市場交易品類雖較過去更為豐富,但并無替代品,健康數據的價格也會相對偏高,難以充分滿足買方的對于數據數量、數據多樣性的需求,亦可能致使買方訓練出的模型價值不抵訓練成本。因此,短期之內健康數據交易市場的交易量仍會維持低位。
因此,當更大規模、更多層次的醫療機構入局,大數據交易所上架更豐富、更高質量健康數據產品后,我們或許能在充分競爭之中看到健康數據交易蘊藏的真正價值——它將成為推動中國醫療體系走向全面數智化的核心之力。
*封面圖片來源:pexels
如果您認同文章中的觀點、信息,或想進一步討論,請與我們聯系;也可加入動脈網行業社群,結交更多志同道合的好友。
聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、復制及建立鏡像等任何使用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.