貝葉斯定理中,有三個重要的概率。第一個叫做后驗概率。這個后驗的“后”是“先后的后”,“驗”是“實驗的驗”。英文叫做posterio probability。后驗概率中的“后”,就是拿到觀測以后的意思。后驗概率就是你拿到觀測以后,你對于某個原因給出的概率大小。這個概率就是最終我們要想的。我們最后選擇的原因,就是后驗概率最大的原因。貝葉斯定理給出的,就是后驗概率的表達(dá)式。后驗概率的大小,由兩個概率的乘積決定。第一個叫做先驗概率(Prior probability)。這個先驗概率,就是我們前面提到的“基礎(chǔ)概率”。先驗概率中的“先”,就是拿到觀測之前的意思。某個原因的先驗概率,是我們在拿到觀測之前對該原因本身發(fā)生的概率的評估,也就是該原因本身發(fā)生的概率高不高。比如飛機(jī)遭遇氣流的概率有多高,飛機(jī)失事的概率有多高。先驗概率依賴于之前對該原因的認(rèn)知,通常可以由歷史數(shù)據(jù)或者經(jīng)驗?zāi)玫健5诙€叫做似然概率(Likelihood probability)。這個概念我們之前介紹最大似然估計的時候講過。某個原因的似然概率是某個原因的情況下能夠觀察到該現(xiàn)象出現(xiàn)的概率,也就是這個原因?qū)@個現(xiàn)象解釋得好不好。貝葉斯定理的公式我在這里就不具體列出來了,感興趣的同學(xué)可以從書中找到,網(wǎng)上也很容易搜到。但是貝葉斯定理告訴我們,后驗概率由先驗概率和似然概率決定。后驗概率最大的原因通常是既對觀測的現(xiàn)象有一定解釋力,本身又常見的原因。有了貝葉斯定理這個工具,我們就可以計算在某個觀測的情況下,不同原因的后驗概率的大小。
第一個道理和先驗概率有關(guān)。先驗概率作為拿到證據(jù)之前對于該原因發(fā)生概率的判斷,在很多場合的重要性要遠(yuǎn)遠(yuǎn)超過似然概率,甚至在很多情況下,我們可以不用看似然概率。一個守門員如何撲點(diǎn)球的例子。守門員撲點(diǎn)球,是一個典型的信息推斷的過程:守門員通過觀察罰球隊員的動作,來判斷他罰球的真正方向,從而做出正確的撲救選擇。因此,當(dāng)前的觀測是“罰球隊員的動作”,我們想要推斷出來的,則是射門球員真正的射門方向。很多一般水平的守門員的思路是:“看他往哪里踢,我就往哪里撲。”這種方法思路,本質(zhì)上是找一個“能夠最好地解釋罰球隊員當(dāng)前動作的方向”。 例如,在觀察到某個“罰球動作”的時候,我發(fā)現(xiàn)“射門方向為右上角”這個原因,可以比其他的射門方向更好地解釋這個罰球隊員的動作,那我就認(rèn)為“右上角”的概率最大,我就往右上角撲球。
這就是我們前面提到的“最大似然估計”。然而,用最大似然估計來判斷罰球方向在實際中面臨兩大問題。第一,點(diǎn)球的球速太快,守門員反應(yīng)的時間來不及。很多情況下,如果守門員看清楚罰球隊員的出腳動作時,再做撲救早就來不及了。第二,罰球隊員的假動作很多,尤其高水平足球運(yùn)動員。你看著他像是往右下方踢,可是他在觸球的一瞬間改變了發(fā)力點(diǎn),球沖著左上方去了。“假動作很多”,本質(zhì)上就是“不同的射門方向,都可以較好地解釋某個罰球動作”。從數(shù)學(xué)上來說,就是各種不同原因的似然概率很相似。當(dāng)不同原因的似然概率相等時,決定哪個原因后驗概率更大的因素,就是先驗概率。對于這個例子,某個方向的先驗概率,是守門員觀察到罰球動作之前,球員朝這個方向射門的概率。換句話說,罰球球員,平常最喜歡往哪個方向射門,那么這個方向的先驗概率就最大。
所以,貝葉斯定理告訴我們,作為守門員,其實沒太大必要看球員現(xiàn)場罰球的動作,而是直接朝著罰球隊員平時最喜歡的方向去撲。我們來看發(fā)生在2006年,德國與阿根廷的世界杯對決的例子。雙方在120分鐘的對決中均無建樹而進(jìn)入點(diǎn)球大戰(zhàn)。在點(diǎn)球大戰(zhàn)之前,德國的助理教練給萊曼送來了一張神秘的小紙條。萊曼每次撲點(diǎn)球前,都要拿出紙條,默默地看上一眼。最終結(jié)果,萊曼對所有點(diǎn)球都判斷對了方向:除了兩個質(zhì)量太高的射門沒有撲出之外,其他全部撲出,直接讓阿根廷人黯然出局。
那么紙條里到底寫的什么呢?德國隊的相關(guān)人員,利用分析軟件,通過統(tǒng)計過去阿根廷射手的點(diǎn)球數(shù)據(jù),總結(jié)出了他們的射門特點(diǎn),然后寫在一張小紙條上交給萊曼。這張紙條從上到下的內(nèi)容依次是:
? 克魯茲:右上角
? 阿亞拉:左下角
? 羅德里格斯:大力抽射右邊
? 坎比亞索:短距離助跑抽射左上角
這些射門特點(diǎn),就是在萊曼現(xiàn)場觀察到他們射門動作前,這些運(yùn)動員的先驗概率。萊曼在場上完全依靠事先總結(jié)的射門特點(diǎn),也就是他們的先驗概率,幾乎不靠現(xiàn)場觀察到的球員的出腳動作就能準(zhǔn)確地?fù)涑隽舜蟛糠值狞c(diǎn)球。這是一個貝葉斯定理在應(yīng)用中將先驗概率用到極致的例子。
我們剛才介紹了先驗概率的重要性。我們來看貝葉斯定理告訴我們的第二個道理,這個道理和觀測的信息量有關(guān)。先驗概率本質(zhì)上是你拿到當(dāng)前觀測之前,對某個背后的原因的認(rèn)知。后驗概率是你拿到觀測后對該原因可能性的一個重新評估。如果先驗概率和后驗概率的差距很大,說明這個觀測讓你對某個原因的可能性有了不同的認(rèn)識,那么這個觀測的信息量就很大。而如果這兩個概率非常接近,那么這個觀測的信息量就很小。所以,從這個角度來講,觀測的信息量與人們對某個原因可能性看法的變化密切相關(guān)。經(jīng)過數(shù)學(xué)推導(dǎo)告訴我們,信息量大的觀測,都具有“排他性”:這個觀測,只有某一個原因能夠解釋,其他原因都不能解釋。這種具有排他性的觀測,就是信息量大的證據(jù)。而同樣,如果某個觀測,不同原因?qū)ζ浣忉屃Χ确浅=咏敲催@個觀測沒有排他性,信息量很小。
所以給出了結(jié)論:某個觀測信息量,不取決于它對某個原因的絕對解釋力的大小,而取決于它對不同的原因相對解釋力的差別。這個道理非常重要。當(dāng)你理解了這個道理以后,你就能看穿騙子常用的一個伎倆。我們來舉個例子,這個例子是趙本山、范偉和高秀敏在2001年央視春晚的小品《賣拐》。小品講述了村里的一個大忽悠(趙本山)是如何一步一步通過“忽悠”把雙拐賣給了一個雙腿健康的大廚(范偉)的。其中有段情節(jié)是下面這樣的。趙本山對范偉說:在最近的一段時間內(nèi),感覺沒感覺到你的渾身某個部位, 跟過去不一樣了?你想,你使勁想……你說實話。
范偉回答:我沒覺著哪兒不一樣,我就覺著我這臉越來越大呀!
趙本山說:對了,這不是主要病癥!你知道你的臉為什么大嗎?
范偉問:為啥?
趙本山回答:是你的末梢神經(jīng)壞死把上邊憋大了。
趙本山問了一個泛泛的問題:是否渾身的某個部位,和過去不一樣了。然后范偉在他的啟發(fā)下,找到了一個觀測“臉大了”。然后,趙本山給出了一個原因:“末梢神經(jīng)壞死”。
稍微仔細(xì)分析一下,“臉大了”這個觀測,其實是無法推斷出其背后的原因一定是“神經(jīng)末梢壞死”。因為即使這個原因可以很好地解釋“臉大了”這個觀測,但其他的原因,例如“長胖了”,也可以很好地解釋這個觀測。也就是說,“神經(jīng)末梢壞死”這個觀測并不具有排他性,它沒有任何信息量。只要我們用到了貝葉斯定理,就能看出來騙子的這個伎倆的模式:找到一個很多原因都可以解釋的觀測,然后強(qiáng)塞給人一個原因。這也是很多忽悠人伎倆所用的方法邏輯。我們剛才講了貝葉斯定理告訴我們的兩個道理,一個和先驗概率有關(guān),一個和觀測的信息量有關(guān)。
在明白了這兩個道理之后,我們就可以來說說從貝葉斯定理推導(dǎo)出來的一套方法。這套方法能幫助一個人做出生活中的各種決策,尤其是預(yù)測自己做某件事情的成功率。具體的方法是這樣的:想要知道自己一件事情的成功率有多少,最好的方法是找到和自己面臨的情況相似的一個圈子,然后用圈子里的人做這件事情的成功率作為自己的“基礎(chǔ)概率”,然后在這個基礎(chǔ)概率上,根據(jù)自身的特點(diǎn)做一個調(diào)整。
這個例子是我自己的親身例子。我父親大概在65歲時,被診斷為“房間隔缺損”,這是心臟病的一種。在當(dāng)?shù)蒯t(yī)院的醫(yī)生表示,如果采取保守治療,那么頭幾年應(yīng)該沒事,但是5到10年以后,情況可能會逐漸惡化,最后大概率會發(fā)展成無藥可治的心衰。如果要做手術(shù)就要開胸,老人家年紀(jì)已經(jīng)很大了,手術(shù)的風(fēng)險、術(shù)后的恢復(fù)和并發(fā)癥等情況都遠(yuǎn)不如年輕人樂觀。所以我們就面臨一個兩難選擇:不做手術(shù),大概只能健康生活10年;而做開胸手術(shù),風(fēng)險較高。這時候,我們該如何選擇呢?這個本質(zhì)問題,是要知道我父親的手術(shù)成功率。我知道北京的某家醫(yī)院的醫(yī)生手術(shù)水平很高,于是我把父親送到了這家醫(yī)院,并且很幸運(yùn)地掛了一位有經(jīng)驗的副主任醫(yī)師的號。我問了那位醫(yī)生三個問題。我:“通常而言,您這里對房間隔缺損患者做開胸手術(shù)的成功率有多少?”醫(yī)生說:“一般不會有大問題,我手里的病人99%都順利出院了。”我問這個問題是想知道一般人在這家醫(yī)院做該手術(shù)時的成功概率。這個圈子,就是在該醫(yī)院做類似手術(shù)的患者。我可以把這個概率作為我父親手術(shù)成功的基礎(chǔ)概率。雖然我拿到了第一個圈子里的基礎(chǔ)概率,但是因為我父親畢竟歲數(shù)大了,不完全符合“一般人”的情況,所以我還想拿到更符合我父親特點(diǎn)的圈子中的對應(yīng)概率,就是“在該醫(yī)院做類似手術(shù),并且年齡和我父親相當(dāng)?shù)幕颊叱晒β省薄S谑俏覇柫讼乱粋€問題:
我:“像我父親這么大年齡的房間隔缺損患者,您之前治療得多嗎?” 醫(yī)生說:“說實話很少。”很可惜,我沒有拿到這個數(shù)據(jù)。我于是又回到第一個基礎(chǔ)概率。現(xiàn)在我需要知道,如果要在這個基礎(chǔ)概率上調(diào)整的話,是否需要有大的調(diào)整。于是我問了第三個問題:
我:“我父親年齡比較大,會不會有很大的風(fēng)險?”
醫(yī)生說:“問題應(yīng)該不大。”
這意味著調(diào)整很小。基于此,我可以判斷,我父親做開胸手術(shù)的話,成功率也會接近99%。這個成功率,值得我們毫不猶豫地做手術(shù)。后來手術(shù)很成功,我父親也順利地康復(fù)了。通過“找圈子”找到基礎(chǔ)概率,然后再調(diào)整的方法,可以用在很多決策中。我在書里也介紹了很多類似的例子,包括孩子能否考上好大學(xué),一個大學(xué)生到底能否找到好工作,一個創(chuàng)業(yè)者的成功率,等等。感興趣的朋友,可以點(diǎn)擊文稿末尾的電子書,做拓展閱讀。最后,貝葉斯定理不僅是一個能夠幫助我們推理的工具,它更是一種世界觀,也就是看待世界的方式。
世界是復(fù)雜的,為了客觀而睿智地看待這個世界,我們需要首先對這個世界的很多現(xiàn)象有基本的常識。這個常識不一定完全正確,但是請不要完全憑借你自己的經(jīng)驗或者從網(wǎng)上看到的零星事例,而是最好能基于可靠的大量統(tǒng)計數(shù)據(jù)來得到。你需要用數(shù)字而不是感覺,用概率而不是非黑即白來思考問題。你建立起來的這個基本的世界觀、基本認(rèn)知或者常識,就是你的先驗概率,先驗概率對于判斷的重要性再如何強(qiáng)調(diào)也不為過。然后,貝葉斯定理告訴我們,我們要勇于接納新證據(jù)和新觀點(diǎn),用科學(xué)的方法檢驗它們的真?zhèn)危⑶矣眠@些證據(jù)來改變你原有的認(rèn)知。這就是觀點(diǎn)隨著事實的改變而改變。在很多情況下,你對某個事物的初始認(rèn)知并不那么重要,只要我們能不斷地通過新的證據(jù)去調(diào)整自己的認(rèn)知,最終也能接近最后的真相。這就是批判性思維和成長型思維。如果你具有了這種思維,你就會不斷進(jìn)步,你的眼光就會比一般人更深刻,你的視野會比一般人更寬廣,你就會成為別人眼中那個睿智的人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.