——《AI羅慢羅懶》第11期——
“平均數陷阱”
平均數并不平均
它很多時候是一個陷阱
2024年央行發布的數據
稱我國人均存款11萬
你覺得這可能嗎?
如果你一家四口
那就是44萬存款
很多人一看就要暴走
想去找央媽討說法
我的錢錢哪去了?
央媽真的吞了你的錢嗎?
別激動
做媽的應該不會這么殘忍
這里存在一個
平均數的“離散偏差”
什么意思呢?
你和滅霸的身高平均一下
大概也有196
還有一個段子:
趙家有錢一千萬
九個鄰居窮光蛋
平均起來算一算
阿Q也有一百萬
真相就在這里
所以不要情緒化
你可能只是被平均了而已
沒有誰私吞你的銀子
當然
這也不能全怪你
因為央媽
沒有公布全部真相
只告訴了你1/3的內容
真相就是
一個完整的“平均數”
其實包括三個數
第一個是“算術平均數”
它是所有樣本的均值
也就是現在公布的平均值
第二個是“中位數”
它是所有樣本里
按順序排列在中間位的數
如果人數總共是9位
那么第5位對應的F(x)值
就是中位數
第三個是“眾數”
它是樣本里
出現最多的那個數
例如14億中有6億人
月收入1000元
這個1000大概率是眾數
真相就是這么殘酷
以上三個數
才是平均數的冰山全貌
因此
如果要實事求是
這三個數需要一起公布
如果只公布算數平均數
那就是耍流氓
例如上海宣稱人均工資9000
很多人非常慚愧
覺得自己7000拖了后腿
但實際工資中位數是6000
而眾數可能是4500
現實的真實情況就是
你的7000已經超過大部分人
別慚愧
上海人民感謝你
這里要注意的是
在一個數據正態分布的樣本里
也就是貧富差距不大的社會
平均數、中位數、眾數
基本相同
但在一個數據離散的樣本里
也就是基尼系數極大也就是貧富不均的社會
平均數、中位數、眾數
差異極大
這個時候的統計結果
如果只公布算術平均數
而不公布中位數和眾數
那就非常的不科學
因為平均數不平均
這樣的數據只會產生幻覺
讓人無法了解全部真相
與大多數人的體驗不符
理解平均數三要素之后
回頭再來看人均存款11萬
這次央媽公布的數據
就應該同時
公布中位數和眾數
也就是排名第7億的那一位
她的存款到底是多少呢?
我先猜一個
可能是5萬元
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.