我們常說的平均數或被平均,通常指統計平均數,是用于反映現象總體的一般水平,或分布的集中趨勢。
在理想情況下,三個反映數據集中趨勢的統計術語應該是一樣的:平均數、中位數(中間位置)和眾數(出現最多)。
當一組數據中,最大值遠超過最小值時,比如一家企業的這級管理者和收入最低的勞動者,工資可能相差幾千倍,此時平均數會高于處在正中間位置的數據(中位數)。
在這種情況下,平均數就不能真實反映數據最集中的分布區域,中位數則正適合這種場景。
在實際的宏觀數據中,我們很少能得到大量的同時公布中位數與平均數的數據。
幾年前,我們在蘇州的人力資源市場工資價位數據中發現過類似的數據(后來沒有了)。今年,我們又在大連的《2024年大連市人力資源市場部分職業(工種)工資指導價位》中,發現了336種職業的中位數與平均數數據。
有了大規模數據,我們就能知道,中位數與平均數的分布,到底是怎樣的,兩者會有多大的差異。
下圖展示了大連2023年度336職業、以中位數為基準的平均數差異。當數據為負時,表示平均數比中位數低。其余的大多情況下,平均數要高于中位數。
數據顯示,336種被調查的職業中,有18.5%的職業,中位數要高于平均數,這是一種很奇怪的統計現象。
由于作者無法獲取到這超過18%中位數大于平均數的原始數據,尚不清楚其間有怎樣的規律。
其余超過80%的數據,比較符合我們的一般規律:在薪酬這類數據中,平均數會大于中位數。
從分布看,22%的數據,平均數只比中位數高不到5%,即平均數基本能反映中間數據的情況。
17.6%的數據,平均數比中位數多5%到10%。高出10%到15%的數據所占比重為14.6%,高出15%到20%的數據占7.4%。
所以,只剩下大約20%的數據,平均數會比中位數高20%以上,其中僅有4.2%的數據,平均數比中位數高40%以上。
當然,一座城市某個被調查職業的收入數據,其使用范圍還是很小的。這里有另一組使用范圍更大的中位數與平均數數據,可供參考。
2024年度全國居民收入與消費支出中提到,全國居民人均可支配收入41314元,全國居民人均可支配收入中位數34707元。
所以,此處的平均數比中位數高19%,處在上圖大約80%的區間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.