近日,上海數據交易所宣布上線了全國醫療體系首批合規、可交易的數據產品,本次掛牌數據來自上海市第一人民醫院眼科、內分泌科、放射科等10個科室及上海申康醫院發展中心行政管理部門,包括20個重大疾病數據產品和1個醫療行政數據產品。
醫療數據具有巨大價值,能被應用于疾病研究、新藥研發、醫療保險開發等諸多領域,在業界一度被譽為“沉睡中的金礦”。但是過去多年來,醫療數據一直走不出醫院機房,存在著數據確權、數據標準化程度低、數據質量不高、使用監管等諸多問題,數據要素的巨大生產力未能釋放。
在醫院、監管方、產業界等多方的共同探索下,醫療數據的應用有望迎來加速發展。
價值倒掛
醫療數據究竟有多大的價值?
早在2019年,國際四大會計師事務所之一的安永曾針對英國的國民健康系統(NHS)做過一次商業化測算。彼時的NHS擁有英國從出生到死亡的所有人口的5500萬份病歷。安永測算后的結果是,NHS的這些數據集經過管理每年可以產生96億英鎊價值,接近900億人民幣。
5年后的中國,不管是醫療數據的體量規模,還是商業世界的轉化空間都要遠超當年的NHS,足以支撐起一個千億級市場。在這個市場中,藥企、商保公司、醫療AI企業都是潛在的買單方。
具體來看,藥企看重的是藥品在臨床世界的使用情況,并以此來倒推前端的研發;商保關注醫療費用結算和診療行為之間的關聯,目的是建立更準確的精算體系;醫療AI企業則希望獲取更多的高質量數據,來提升AI產品的性能,尤其是在大模型時代,這種需求被無限放大,甚至可以決定一家企業的存亡。
至此,我們談的都是理想,真實的情況遠沒有那么樂觀——根據國家衛健委統計信息中心的數據,2020年,國內三級醫院的醫療數據應用數量占比不足20%。德勤的最新報告則顯示,全球范圍內,醫院生成數據的使用率僅為3%。
“原因就是目前的醫療數據,使用起來難度極高,專業度極強,而且投入極大,它的清洗治理成本要遠遠大于它能產生的價值。”醫療大數據行業的資深從業者易明告訴《健聞咨詢》,他曾經參與過多個醫療數據服務項目的落地執行,大多數時候,醫院提供的原始數據和企業所預期的,都相去甚遠。
他向《健聞咨詢》講述了一個案例,他曾經承接過東部某家三甲醫院的專病項目,需要就某個腫瘤的某個指標,對特定人群進行數據分析。這個項目的第一個步驟就是要從醫院的LIS(實驗室信息系統)中導出這些患者歷年的檢查檢驗結果,但在操作過程中,他發現這些化驗單的信息和診斷對不上,最后他只能按照這些化驗單號,去醫院的HIS里撈診斷信息,“一來二去,一個本來想自動化解決的問題,變成了純人工服務,到最后項目的成本遠遠超出了公司的預期。”
易明碰到的并不是個例。對于大多數醫院來說,幾十甚至上百個信息系統,都是常規配置,這些系統的搭建時間各異,供應商不同,所以往往不能相互連通。更讓數據服務商抓狂的是,這些系統的數據甚至會自相矛盾。
另一位醫療信息化企業的產品負責人劉棟分享了這樣一個經歷。幾年前,他在為某家醫院做數據產品研發時,發現連門診量、出院人次、手術量這樣的核心數據,從不同系統中統計出來的值都不一樣,最后只能找醫院的相關領導選定某一個值,項目才得以推進。
“說到底,醫院做了那么多系統,做電子病歷,都只是為了把這些數據存儲下來,或者是應付評級的需要。所以它不太會去考慮數據質量,這從根本上導致了醫療機構所提供的數據和企業需求是錯位的。”
確權之殤
正如劉棟所說,醫療數據來自醫療機構,醫療數據質量不高,和醫療機構對數據的認知有直接關系。在醫院信息科的傳統認知里,醫療數據除了應付信息化評級,供內部人員調取外,并沒有其它的落地場景,和商業運作更是毫不沾邊。
但事實顯然并非如此。
從大體上來看,醫療數據可以分為兩類,一類是具有可識別特征的患者個人信息,這類信息涉及患者個人隱私,如果想要開放使用,必須征求患者的同意。另一類是不可識別的信息,也就是脫敏后的患者數據,常用于疾病研究、新藥研發等領域。目前,多數醫院和商業機構的合作就是基于這一類數據。
基于某個科研項目或臨床產品的合作是商業機構獲取醫療機構數據最常見的途徑。以劉棟所在的企業為例,為了獲取高質量的診療數據,他們往往會和醫院達成共同開發某款大模型應用的協議,并承諾使用保密級別最高的國密算法加密,確保數據全程不可見,不出院。作為條件,開發出來的大模型產品,醫院不僅可以免費使用,還能擁有部分知識產權。
“我們之前覺得這個過程可能會不太順利,但實際溝通下來,要比預想的好很多。尤其是大三甲醫院,他們也知道現在的科技進步是能幫醫院做很多事情的,所以在風險可控的情況下,它們都愿意接受新鮮事物。”劉棟表示。
而在中國社科院公共政策研究中心特約研究員賀濱看來,即便是這樣的合作,也未必能做到完全合規。首先,由于數據確權不清,醫院是否有權轉讓特定數據的使用權,還需要打上一個問號。其次,在項目進行過程中,存在著由于安全保障機制不足導致的數據泄漏風險,另外,即使醫院與企業之間達成了某種合規約定,但如何在合作過程中對數據安全進行有效監管,也是一個問題。
這就指向了醫療數據商業化應用的最大瓶頸——產權歸屬。
理論上來說,醫療數據作為一種資源要素,必須要有產權歸屬的定性。但根據現有的法律法律,不論是《網絡安全法》、《數據安全法》還是《個人信息保護法》,都沒有對這一塊做出明確界定。而產權歸屬未定,就無法進入到交易環節,商業化也就無從談起。
“現在的情況是,因為法律法規在這一塊是空白的,所以大家都在嘗試和探索。”賀濱告訴《健聞咨詢》,醫療數據的確權在全世界都是一個難題,原因是醫療數據所屬的主體非常分散,涉及到個人、醫院、企業乃至政府,且同一個患者的數據可以被多個主體留存、復用和更新,無法追根溯源。
但從另一方面來說,法無禁止即可為,這也給了行業更多的創新空間。賀濱說,現在常見的數據開放形式有兩種,一種是前面提到的,企業和醫療機構之間通過非商業化的項目合作。另一種則是,企業通過參與政府主導的某項醫療相關的民生工程,比如微醫承接的天津數字健共體項目。
但這兩種模式都只是解決了數據獲取的問題,還無法為數據交易提供合法化的依據。
且看長遠
隨著醫療行業對數據資產化的呼聲越來越高,政策層面也陸續釋放了不少積極的信號。
2022年12月,中共中央、國務院發布了《關于構建數據基礎制度更好發揮數據要素作用的意見》,全文總共二十條,因此也被稱為“數據二十條”。
其中一句極為關鍵的表述為,“建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,推進非公共數據按市場化方式‘共同使用、共享收益’的新模式,為激活數據要素價值創造和價值實現提供基礎性制度保障。”這句話從頂層設計上破解了醫療機構數據治理動力不足,不敢開放共享的桎梏。
2023年,國家層面又發布了《“數據要素x”三年行動計劃 (2024-2026 年)》,邁出了從宏觀政策到具體行動的關鍵一步。從這一年起,各地先后出臺政策試點,基本思路是,由政府或央國企牽頭組建地方數據交易平臺,授權第三方機構開展數據要素運營。
比如,上海市在2023年提出,在確保信息安全和個人隱私的前提下,依托市大數據中心平臺,探索醫保數據在個人授權后面向商業保險理賠方面的開放。今年,上海數據交易所又推出首個數據空間——“重大疾病行業創新中心幽門螺桿菌數據空間”,率先推動數據在藥物研發領域的應用。
“政府花了大力氣來做這件事,目標是多元化的,方便老百姓的就醫,支持AI產業的發展,為醫療機構探索出一條數據變現的路子,當然最重要的一點,它想要把醫療數據這種高度敏感的資源掌握在自己手里,把住數據風險的源頭。”賀濱表示。
從本質上來說,地方數據中心的設立,為醫療數據交易提供了合理化的可能。它繞過了數據產權歸屬的爭議,以使用權和經營權作為所有權的替代,以政府信用作為背書,搭建了一個醫療數據流通交易的平臺。
“最近這一兩年,醫療機構的數據質量提升得很快,這是我們在業務一線的明顯體會。”劉棟表示,過去單個醫院的項目,他們常規要花兩個半月左右的時間進行數據清洗,現在對于一些數據管理規范的頭部醫院,清洗時間減少到了一個月。在他看來,政策層面的風向,已經傳導到了醫療機構這一端,并且給企業帶來了正向回饋。
但對于醫療數據資產化能否催生出一個千億級市場,他表現得極為謹慎。“我們現在還處于當中非常原始的階段,這個過程會非常漫長。”
易明也在采訪中表達了類似的觀點,他說,這些政策出臺后,自己接到了很多企業方的需求,但聊下來發現,大多數企業只是想趁著這波政策紅利做一些數據化的產品來包裝自己,主要目標不外乎是融資炒作,抬高估值。
“只能說是隨著時間推移,等搞噱頭騙融資的這陣風過去,才會出現一些踏實做事的人或公司,把這件事再往前推一推,我們才能真正看到它所產生的價值。現在還在風口的上升期,我預估要三五年后見了。”
(文中易明、劉棟皆為化名)
文 / 毛曉瓊
編輯 / 龐貝貝 李琳
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.