大數法則與小數定律[1] 01 什么是大數法則
在數學與統計學中,大數定律(英語:Law of large numbers)又稱大數法則、大數律,是描述相當多次數重復實驗的結果的定律。根據這個定律知道,樣本數量越多,則其算術平均值就有越高的概率接近期望[2]。
大樣本、大容量里延伸出來的規律和經驗,才是有參考意義和預測價值的。
02 什么是小數定律
小數定律認為人類行為本身并不總是理性的,在不確定性情況下,人的思維過程會系統性地偏離理性法則而走捷徑,人的思維定勢、表象思維、外界環境等因素,會使人出現系統性偏見,采取并不理性的行為。大多數人在判斷不確定事件發生的概率時,往往會違背概率理論中的大數定律,而不由自主地使用“小數定律”,即濫用“典型事件”,忘記“基本概率”[3]。
小樣本、小容量、不具備普遍性的研究中得出的結論和經驗往往更容易極端、不正確。
03 隨機事件的不可解釋性
統計學中有幾個比較常見、但容易被人的直覺遺忘的概念——「隨機事件」就是其中之一!
「隨機事件」:是在隨機試驗中,可能出現也可能不出現,而在大量重復試驗中具有某種規律性的事件叫做隨機事件。
拿扔硬幣舉例:在這個隨機試驗中,正面可能出現、可能不出現,概率為 50%,但在次數足夠多的嘗試過后,我們可以統計、線型擬合出——大樣本容量下、足夠多的次數下,正反面出現的概率各為50%。
隨機事件有一個先天特點……嗯…——它是隨機的,哈哈哈,不說廢話——隨機事件因為它的結果出現是隨機的,因此是不可預測的;或者說對于他的預測是沒有實際意義的,因為若干結果是等概率出現的。
隨機事件因之于它的隨機、它的不可預測常常被我們下意識的遺忘——所以我們總是在預測時受前面結果的影響、在統計時主動的位置找尋貌似合理的解釋。
比如猜硬幣的正反面:如果一個人連著出現了三次正面,那么很多人下一次的猜測總會有自己的理由。
? 理由 1 :前面三次都是正面,那么這次也大概率是正面,我就猜正面。 理由 2 :前面都出現三次正面了,這次不太可能是正面,我還猜反面。 理由 3 :前面出現的任何情況都與后面的預測結果無關,隨筆猜正面。 ?
顯然,三個解釋看似都具有一定的合理性和邏輯性,也是可以說服一些人的(起碼可以說服當時的自己)。但真正正確的,其實只有理由 3 ,因為隨機事件本就不可預測、前后互不相干。
也給我們一個啟發:「不是所有看似合理的、有邏輯的解釋,都是正確的。不要為一些已然發生的事情尋找理由和借口,因為你總能找到,且總能說服一心尋找借口的你自己」。
04 生活事例 001 籃球比賽
在籃球比賽里,哪怕有球員手感爆棚 or 手感冰涼,他投下一個球的進球概率永遠是 50%,這是一定一定不會變的!
至于球員因為狀態的好壞,而使得我們以為他今天投籃進球概率的改變(可能高于 50% or 低于 50%),其實是一種錯覺——一直都是 50%,高于或者低于,都是巧合!
002 文字排列
長度為 6 個字,在“可”“愛”兩個字里尋機挑選其中一個,進行排列。
? 可愛可愛可愛 可可可愛愛愛 愛可可愛可愛 愛愛愛愛愛愛 可可可可可可 …… ?
你覺得哪個出現的概率更大一些?我想很多人會選 1、2、3,因為里面兩個字都出現了相同次數。
但其實,每一種排列組合出現的概率都是一樣的 50%,沒有哪個是更有可能、更大概率出現的!
因為他們前一個字的出現,并不會對后一個字產生影響,因為這是個隨機事件。
003 比大小游戲(綜合運用)
兩個人比大小的游戲,擁有以下哪個條件的一方可以先勝出[4]。
? A:有錢、資本多 B:手熱、運氣好 C:聰明、會計算 D:沒有獲勝方 ?
正確答案應該是哪個呢?不要直接看,好好運用上面的原理,思考片刻!真的會很有意思。
正確答案是:A
兩個人玩極其簡單的比大小游戲,除去沒有意義的平局,那么只有兩個結果——大 or ??!并且這兩個結果出現的概率是相等的,同為 50%!
但我們一定一定要注意一點:隨機事件的預測概率、實際概率、統計概率是有區別的(我自己取的幾個名詞,目的是方便陳述、方便理解)。
? 預測概率:只和結果的總個數和占比有關,并且前后沒有相關性、互不影響。 「實際概率」:在小樣本、有限次數內的呈現效果,并不符合預測概率和統計概率。扔硬幣3次,可以是1正2反;可以是1反2正;更可以是3正;還可以是3反——每一種呈現結果,都不符合預測概率和統計概率中的 50%! 統計概率:統計概率相當于是預測概率的科學、統計證實——足夠大樣本、大容量、多次數的重復下,統計概率的結果會與預測概率無限趨近、極限擬合。 ?
所以兩個人玩比大小游戲,當次數還不夠多時——比如前 3、7、10、11 次,可能會出現各種各樣的比賽結果,顯然,一方連著?。ㄝ敚?1次的情況也是可能存在的。如果你的資本有限,就很難對沖掉出現連輸 11 次的狀況,然后雙手插兜、兩手空空,就直接遺憾出局了。而資本足夠大的那一方,他可以對沖幾乎所有的不利狀況,哪怕他連輸 11 次、連輸 20 次,甚至更多,因為它有著足夠的資本,所以他永遠可以扛住。
你們明白為什么賭桌上,莊家常常是贏錢的那個嗎???就是因為專家有足夠的資本,理論上來說可以進行足夠多次數的博弈——直至出現統計概率 50%、在賭注不變的情況下,雙方不輸不贏。但很少有下注的人有莊家那樣雄厚的資本——維持到兩人可以持續足夠多的局數,在某一局,就倒下了。
05 有什么作用
了解這兩個統計學規律后,我們可以給生活帶來一些改變:
? 001、未來的研究生、科研人員們,做實驗前,一定要嚴謹對待樣本容量的選取,用更科學的方法去計算和模擬,選擇一個有可信度的大樣本容量——讓自己的結果更加的有意義。 002、我們去瀏覽文獻和一些相關的說明時,一定要對它選取的范圍和對象的廣泛性保持“高敏感性”,一旦察覺到它的調查范圍不合理、有特殊性,那么可以懷疑它的權威性。 003、不要嘗試著忽視和否定已經存在很久的、很權威的、基于大數法則所發布的科學事實——它們可能太過平常、普通,導致我們毫不重視。 004、也不要嘗試著計較和專注那些很新穎的、吸人眼球的、基于小數定律所發布的猜想和假說——它們或許讓人眼前一亮、印象深刻,但猜想和假說終歸不是金科玉律和真相——所以不值得過分關注。 ?
我努力調用生活中聽聞、經歷過的事例,雕琢陳述的語言,希望我講述的“大數法則”和“小數定律”,你們有所收獲。
「References」:
[1]:概念引用自《思考 · 快與慢》
[2]:大數法則的解釋,引用自”維基百科“
[3]:小數定律的解釋,引用自“百度百科”
[4]:比大小事例改編自李笑來所著《財富自由之路》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.