一、數據治理,治的是什么?
1.數據分散割裂未整合,無橫向關聯,形成數據煙囪。
2.各類數據標準未統一,沒建立統一的公共值域字典。
3.未具備數據共享服務能力,數據資產無法集中管理,導致共享性差,數據利用程度低。
4.未建立數據全局視圖,無法探查到源頭數據問題。
5.數據安全得不到保障,無法追溯數據調閱記錄。
6.數據接口、數據采集鏈路、備份策略無精細化管理,緊急業務需求下,從頭梳理計算口徑,無法持久化經驗,不成體系。
二、如何做好數據治理?
1.建立數據畫像,避免數據分類一刀切,落實分級而治:
字段級:
值域分析、類型檢測、數據分布、異常值分布。建立知識庫,積累字段異常和處置措施,對外進行公開共享。
庫表級:
關聯性分析,業務域標記,增量時間戳標記,入庫頻次標記,對不同業務數據建立及時性評判依據,如門診、住院業務每日,病案首頁每月,死亡記錄以每年為維度,構建數據時效性分類目錄,進行數據及時性考核。
指標級:
由電子病歷、健康檔案數據集為基礎,進行指標計算追溯,構建指標血緣鏈路,可視化指標衍生過程,形成由表到字段到值域的衍生計算公式,并結合數據質控結果進行分析比對,研判出數據質量對業指標精準度的影響,為數據治理找準主攻方向。
2.系統整合:
第一步,構建患者主索引。用來解決,同一個患者被多個信息化系統進行共同管理,但在不同系統之間,公共基礎屬性參差不齊導致主索引精度丟失。
第二步,構建可信數據計算空間。保障數據在跨系統協作和跨部門數據流通的場景下的絕對安全,對于待接入的業務系統落實先注冊,完成用戶、角色、菜單權限的萃取,形成統一登錄不同鑒權的數據隔離,對于業務數據庫實現動態密鑰管理機制,實現數據“可用不可見”的可信計算,降低一切數據泄露風險,統一用戶清單,構建用戶與業務系統間的知識圖譜,真政意義上完成系統整合工作。
3.互聯互通智能體:
全民健康信息平臺運作的根基就是互聯互通基礎通道,數據匯聚工作是輔助業務決策的根基。對于標準不統一,采集工具雜亂多樣的問題,是影響平穩采集的主要真兇。統一采集工具的核心目的在于集中管理各醫院貼源層業務數據到省級數據中心的全鏈路匯聚通道。
構建一個省級大腦16市級神經元N個院端神經末梢的數據傳感器,對于異常采集鏈路進行定點定位,進行事中補救降低由于斷傳導致對業務監管力度的影響。同時,通過統一的全省互聯互通平臺收集錯誤日志萃取異常信息構建知識庫,建立數據應急處理保障機制,統計十六市采集異常分布,提供精準解決指導,群力群策共建穩健數據傳輸通道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.