在臨床研究領域,數(shù)據(jù)的質(zhì)量直接影響到研究結(jié)果的準確性和科學性。
醫(yī)咖會 視頻 課程《在開始統(tǒng)計分析前,如何對數(shù)據(jù)進行清洗或轉(zhuǎn)換?》包含四部分內(nèi)容:(1)引言;(2)數(shù)據(jù)探索;(3)數(shù)據(jù)清洗;(4)數(shù)據(jù)轉(zhuǎn)換。
本課程深入講解了如何運用多種方法對數(shù)據(jù)進行有效的清洗和轉(zhuǎn)換,包括如何科學地填補缺失值、合理地轉(zhuǎn)換數(shù)據(jù)類型,并利用啞變量轉(zhuǎn)換增強回歸模型的解釋性等,以提高數(shù)據(jù)質(zhì)量并滿足統(tǒng)計分析的前提條件。
本課程適合所有需要進行臨床研究數(shù)據(jù)分析的專業(yè)人士,包括研究人員、臨床醫(yī)生、數(shù)據(jù)分析師和醫(yī)學生。
這里分享其中一課《異常值及其處理方法》。 點擊左下方“閱讀原文”,即可查看完整視頻!
異常值是指樣本中的個別值明顯偏離所屬樣本的其余觀測值。異常值存在的原因有三點:(1)數(shù)據(jù)錄入錯誤;(2)測量誤差;(3)真實的異常值。如何在保留數(shù)據(jù)信息的基礎上,識別異常值,并對異常值進行有效處理,是數(shù)據(jù)清洗步驟中一個非常重要的環(huán)節(jié)。
異常值可分為3類:強影響點、離群值和高杠桿點。
異常值的處理包括四個方面:(1)核查數(shù)據(jù)是否存在收集或錄入錯誤,如果是錄入錯誤,則用正確的數(shù)值進行替換,及時更正數(shù)據(jù);(2)保留異常值,但需符合變化趨勢;(3)刪除異常值(注:當需要刪除異常值時,應報告異常值的大小,及其對結(jié)果的影響);(4)將異常值納入分析。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.