說到選擇或者決策,我們大都把注意力放在“選”這個動作以及選擇過后所產生的結果上,很容易忽略掉構成選擇的關鍵要素——選項。有的時候,選項顯而易見,就像菜單上的小吃和甜點,但大部分生活中的選項都隱藏在伊西斯的面紗之下,而這些選項是自然給我們設下的陷阱還是憑人類自身的理智所構建出來的路徑的區別,也是困擾了哲學家多年的決定論與自由意志之爭。
姑且放下形而上的爭執,如今越來越多的人認識到好的問題比答案更重要,也可以由此擴展到,好的選項比選擇本身更關鍵。那么什么又是洞見選項的基本能力呢?說起來并不復雜,它就跟我們日常的生活緊緊的關聯在一起,那就是——分類。
想要將某個人歸入某一類別(朋友或敵人:值得信任或不值得信任)是人類與生俱來的天性,對事情的歸類也是如此,這種渴求為智力發展提供了基礎。如果我們不去構成類別,我們就只能注意到個例,而觸及不到任何總體性思考。
可以設想,如果一個常人缺乏分類的能力,他就會迷失在浩如煙海的日常事務中——他無法識別朋友和敵人,甚至都不會構建“朋友”這樣的詞語,他身邊只能是一個個獨特的個體;他也無法識別蘋果,他只能認識到一個個長得略有不同的能吃的東西。以此類推,在在他的頭腦里,是無法想象“人類”、“世界”、“宇宙”這樣的存在的,因為只有分類,才能讓我們借由個體達到總體。
從形式上看,選項就是在某一些規則之下的分類。所以在做選擇之前,學會更好的分類,可能比在選項之間比來比去更加重要。在《分類思維:不確定情境中合理決策的科學與藝術》這本書中,作者就將最佳選擇的探索延伸到分類上,探究在不確定的世界里構建一種好的分類方式以獲得優秀決策的方法。
“分類是指根據線索使用分類規則將個體分配到各個類別”。不過分類并不是看起來這么簡單,當我們深入去體會這個概念,即可找到分類的兩種層次動作:一種是構建分類規則,另一種是根據分類規則將具體的事物分配到各個類別當中。很明顯,構建分類規則相對來說更基礎,也更重要。
如果我們能夠找到最佳分類方法,那么就可以避免掉大多數因為選項錯誤所導致的決策失誤。比如,如果我們希望車輛可以在紅綠燈前面自動決策的話。那就要根據紅綠燈的規則來構建一系列的決策分類,這個相對來說比較簡單,考慮到直行、左轉和右轉在三個燈下的狀態,無非也就是九種分類而已。但問題在于現實世界中任何一個路口,都不會僅僅只有紅綠燈,還有著眾多的交通參與者,這樣規則就變得復雜起來,即便不考慮所有情況,規則也會乘法級的增長。
所以近些年自動駕駛的研發逐漸放棄了規則算法,轉而尋找適應性更強的方式。本質上就是在現實情境中,未來可能以不可預知的方式不同于過去,最佳分類規則是不可知的。在一個穩定、可控的世界中,根據過往的經驗進行微調的規則很可能會成功。微調往往會導致統計數據和機器學習的標準庫提供復雜的分類規則。相反,在動態、不穩定的現實環境中,變化可能會突然發生,對過往經驗進行微調可能會導致巨大的預測錯誤。在這里,規則的復雜性可能需要在一定程度上減少而不是增加:現實情境中,簡單規則表現良好。
在分類思維這本書中,就提出了一個鮮明的觀點:簡單規則反而在現實情境中表現良好。在國際象棋、圍棋或人臉識別等穩定的情況下,如果有大量數據可用,復雜算法的表現優于快速節儉啟發式。相比之下,在現實情境中,未來是不確定的,而且未來可能以一種不可預測的方式不同于過去,無論可用數據規模是大是小,簡單的啟發式都可以勝過復雜的方法,并稱此為“不穩定世界原則”。
“啟發式”這個詞源自于古希臘,意思是“積極主動地發現或探索”。18世紀被引入到英語中,是指代解決那些難以用邏輯和概率論加以處理的問題、有用甚至不可缺少的認知過程。分類思維這本書關注兩類啟發式,這兩類啟發式開發了人類智力的兩個核心能力:計數和排序。計數啟發式只計算將個體分配至某一類別的原因。快速節儉樹對原因進行排序,并使得使用者基于其中一個或幾個原因就能做出快速決策。
這聽起來可能有些學術,可以通過兩個例子來分別理解計數法和快速節儉樹。
每四年一次的美國大選,不僅關乎美國人的日常生活,甚至還會影響世界政治、經濟走勢。所以人們往往希望在大選結果產生前預測誰能夠入主白宮。當然這其中最常用的就是傳統的民意調查法,如果想要獲得更精準的結論,就要耗時耗力,擴大樣本所涵蓋的類別等等,而準確度也難以保證。有一位歷史教授,通過一個簡單的方式,就能夠輕松地使得自己預測的準確度超過大多數民調。
這個方法就是“13把進入白宮的鑰匙”:拿到6把(即問題結果為否),挑戰者獲勝,否則執政黨獲勝。以下就是這13個問題。
1、執政黨授權。中期選舉后,執政黨在美國眾議院比之前的中期選舉后持有更多的席位。
2、提名競賽,現任黨內沒有激烈的提名競爭。
3、在任,執政黨候選人是現任總統。
4、第三黨。沒有重要的第三方或獨立參選人。
5、短期經濟。競選期間未陷入衰退。
6、長期經濟。在這一總統任期內,實際的年人均經濟增長等于或超過前兩個總統任期的平均增長。
7、政策變化,現任政府對國家政策產生重大影響。
8、社會動蕩。任期內沒有持續的社會動蕩。
9、丑聞。現任政府沒有受到重大丑聞的影響,
10、外交、軍事失敗。現任政府沒有在外交、軍事事務上出現重大失敗。
11、外交、軍事成就。現任政府在外交、軍事事務上取得了重大成功。
12、在位者個人魅力。執政黨候選人具有超凡魅力或是一位國家英雄,
13、挑戰者個人魅力。在野黨候選人既沒有個人魅力也非國家英雄。
這13把鑰匙有一些特別之處——所有的鑰匙都聚焦在執政黨、執政黨過去的表現、執政黨當前的候選人上,唯一的例外是鑰匙13關注的挑戰著個人魅力。(答案是,執政黨拿到鑰匙,答案否,在野黨拿到鑰匙)。而且這13個問題沒有權重,一視同仁,拿到一個積一分,最后計算總分即可。
這就是計數法的本質:在不確定的情況下,人應該簡單地計數,而不要試圖權衡比重。
再看一個快速節儉樹的例子。在美國快速的HIV篩查一般分為三步,先做一次酶免疫測試,陰性則停止,并確認無HIV,陽性則繼續再做一次酶免疫測試,陰性則確認無HIV,陽性則再進行一次蛋白質測試,陰性則確認無HIV,陽性則確認HIV感染。
其實這并不是一種“最佳”的規則,如果“最佳”的定義是最大化的檢測出HIV感染者以及最小化誤診。因為第一次酶免疫測試,一定有一些沒有被檢測出來的HIV感染者,最后被宣布無HIV。但是,因為這個概率比較低,如果為了找出那些遺漏的HIV感染者,將會耗費大量的人力物力。所以最終采用了一種更為“節儉”的決策樹。
如果用符號K表示線索(檢測次數)的數量,這里K等于3。如果一條線索只有兩個值,如“正/負”(即陰性陽性),則這條線索稱為二元線索。快速節儉樹中,可以進行分類的空間稱為“出口”,一個快速節儉樹正好有K+1個出口,跟完整決策樹的檢索出口數量即2的K次方相比,當K大于2的時候,節儉樹就有優勢,K越大,優勢越大。所以使用快速節儉樹來替代完整決策樹?可以大大減少檢測上的時間,減少醫療系統所承受的負擔,同時可以用相對較少的漏報為代價保護大量個體不被誤診。
在此補充一些醫療檢測當中的關鍵定義。首先大前提是,任何一種針對性的檢測,都不是百分之百準確的,這意味著有一部分真實的病人未被檢測出來,同時還有一部分健康的人被誤診。所以針對真實陽性和真實陰性情況,對應檢查出來陽性和陰性,就會有四種情況:
真實陽性被檢測出陽性稱為命中,也叫做真陽性;真實陽性被檢查出來陰性則成為漏報,也叫做偽陰性。命中與命中和漏報的總和的比稱為命中率或靈敏度。真實陰性被檢查出陰性稱為正確拒絕,也叫做真陰性;真實陰性被檢查出陽性稱為誤報,也叫做偽陽性。誤報與誤報和正確拒絕之和的比例被稱為誤報率。
當我們再聽到,比如一個乳腺癌檢測命中率為75%時,先不要著急下結論說這個檢測很管用,看看它的誤報率,比如平均誤報率為46%,意味著大約每隔一個人就會出現沒有患乳腺癌的女性被該測試診斷為患有乳腺癌的情況。這種高命中率的代價是將更多的為患病的人誤報作為基礎的。相比之下,正常的乳房X光檢測篩查的命中率約為80%,但誤報率在10%以下。
這是一個小小的題外話,分類思維這本書,核心就要告訴我們的是,真實世界中存在著線索的不確定性,線索權重的不確定性以及最佳分類規則的不確定性。因此,如果去構建一個“最佳”分類規則去盡可能準確地描述過往的分類,就可能會引起錯誤的判斷,與此相反,我們認為,簡單啟發式(例如計數和快速節儉樹)可以在現實情境中表現良好,因為它們依賴于穩定的原則來減少錯誤。
快速節儉分類最典型的特征是簡單。簡單是由兩種方式實現的:首先,分類使用的線索相對較少;其次,各條線索以簡單的方式組合。因此,分類可以快速進行,要理解和解釋分類背后的邏輯推理也很簡單,考察了兩種最簡潔的方法,第一種方法稱為“計數”,在同一時間使用各條線索,賦予他們相等的權重。第二種方法稱為“快速節儉樹”,按順序使用各條線索,一次使用一個,對線索施加優先級順序。
雖然這本書中陸續介紹了很多計數法和快速節儉樹的構建方法,但很多都需要過硬的數學功底和相應的計算工具的輔助,對程序開發可能有比較大的幫助,但對于普通人來說,只需要記住,它反對了一種普遍的觀念,即復雜的分類方法總是更好,更多的數據總是導致更高的準確性,盡管在確定的和完全控制的情況下(未來和過去相似),這種觀念是正確的,但是在不確定的和缺乏控制的情況下,這種觀念就不見得成立了。在這樣的情況下,簡單的規則可以根據較少的信息進行更準確的預測,并且,簡單的規則更加透明、更易懂,以便啟動操作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.