一
和人最大的不同之處是,AI永遠不會說不。?????
這不止是說,當你給ChatGPT派任務時,它永遠會給你一個答案,哪怕是一本正經地胡說八道。
還因為,AI模型的工作方法很大程度上是基于概率:
“它們估計所有選項的概率,即使所有選項的正確概率都極低,它們仍然只會選擇概率最高的路徑。”
有人會說,這不是人之常情嗎?
面對兩個蘋果,傻子也會選大的呀。 然而,兩個蘋果是確定性的,是眼見為實的。 一旦變成概率,大多數人就不會了--
“什么是概率?一件事情發生了就是百分之百,沒發生就是零,哪里有什么30%啊,60%啊,根本不存在。”
更別說,還是兩個正確率都很低的概率。這時,即使是概率信徒,也會失去了選擇的力氣。
比方說,一個相信概率的人,可能會在70%和80%之間選后者。
但如果一個數值是3%,一個數值是5%,還有啥可選的?
如果希望僅為3%或5%,那就相當于毫無希望,根本沒有選的心情了。
我想將其稱為“決策厭惡癥”:
絕大多數人處在僅有“小概率可能”的環境里,就會放棄思考,失去向前選擇的動力,只想躺平。
想想看,當你遇見事情一團糟,或者做事條件不充分,未來毫無頭緒,哪里還有心情在一堆壞事里面,去找那件相對不那么壞的事情?
與人不一樣,AI永遠會行動,即使所有選項的正確概率都極低。
AI永遠會給你答案,哪怕一切模糊不清,“仍然只會選擇概率最高的路徑”。
而一旦以上動作可以迭代循環往復,就會產生驚人的智能。
只有特別厲害的人才會如AI一樣:
哪怕選項再糟糕,也會冷靜地選擇概率相對較大的那一項,然后全力以赴做好。
二
棋手卡帕布蘭卡說:“我只向前看一步,但總是正確的一步。”
這看起來有點兒奇怪,作為一名棋手,難道不應該向前計算很多步,高瞻遠矚,運籌帷幄,為什么只向前看一步呢?”?
的確,所有偉大的棋手,以及決策高手,都會比對手計算得更深遠,并且以終局勝利作為評價當下一手的價值標準。???
然而,即使如此,你也只用為接下來要走的那一步操心。????
以圍棋AI為例,它會計算幾個主要落子點的終局勝率,然后從中選擇勝率最高的那一手。?????????????
這是一個典型的馬爾可夫決策過程。????
馬爾可夫性質(或稱馬爾可夫性)是指一個隨機過程的未來狀態只依賴于當前狀態,而與過去的歷史狀態無關。簡單來說,這就是“無記憶性”。
在馬爾可夫鏈的每一步,系統根據概率分布,可以從一個狀態變到另一個狀態,也可以保持當前狀態。狀態的改變叫做轉移,與不同的狀態改變相關的概率叫做轉移概率。
下棋具有馬爾可夫性質。在這些游戲中,下一步的決策只需要考慮當前的棋局狀態,而無需考慮達到這個狀態之前的所有步驟。
換句話說,棋盤的當前狀態(即每個棋子的位置)包含了決定游戲未來走向的所有必要信息。
所以,可以說下棋游戲符合馬爾可夫性質,因為你不需要知道游戲是如何進行到當前這一步的。
只要知道當前棋盤上各個棋子的位置,就足以決定你的下一步棋應該怎么走。
1、面對未來,以終局為目標,但只操心下一步;
2、回望過去,壓縮可用價值,忘掉得失和情緒。
這才是活在當下的真義。
三
大神Stephen Wolfram談及,ChatGPT嘗試寫一篇文章時,基本上只是在猜:下一個單詞應該是什么?
我們假設已有文本為“人工智能最擅長的一點是...”,然后想象一下掃描數十億個人類編寫的文本(例如網絡內容和數字化書籍),找到所有這些文本的實例,看看下一個單詞出現的頻率是多少。這里概率最高的下一個英文單詞是學習(learn)。
如何計算這些概率呢?Wolfram介紹說:
大的想法就是制作一個模型,好的模型是與人類看法相一致的函數結果,這里就涉及到了神經網絡,它可以被認為是對大腦是如何工作的簡單理想化表達。
ChatGPT的神經網絡基于有數十億個權重的數學函數,根據它所看到的訓練內容,查看數十億頁的文本),“合理地”去猜下一個單詞。
所以,AI的“只看下一步”,不止是胸懷全局,還是一個強化學習的過程。?
在強化學習中,代理(agent)通過與環境交互,進行一系列的動作,從而嘗試最大化累積獎勵。
每個動作都會導致環境狀態的改變,每種狀態都有一個與之相關的獎勵。代理的目標是學習一種策略,該策略能夠根據當前的狀態確定應采取的最佳動作。
機器學習的訓練,令AI的預測越來越準。在與環境的交互過程中,智能體持續自我改進,不斷進化,進而實現了整體的更大回報。??????
從這個角度,更能理解胡先生說的--科學家明知真理無窮、知識無窮,但他們仍然有他們的滿足:
進一寸有一寸的愉快,進一尺有一尺的滿足。
四
選擇最接近的,而非追逐完美。
如笛卡兒所說:
當追隨真理超出了我們的能力時,我們應該追隨最可能是真理的東西。
笛卡爾的這句話,和AI的邏輯有些像。
我們總是生存于在混亂、不完備的狀況之中,如果我們總是糾結于要想明白,要條件充分,要明明白白,要大概率,那就寸步難行。
在已知條件下,找到對你的全局利益相對而言比較優的一手。
馬斯克提過類似的工作方法,他說,你應該設好大目標,別太擔心現在和目標之間的山高水長和種種殘缺,每次想好朝著目標的最優下一步即可。
大處堅定,小處靈活。 辛頓也是一類人,不然神經網絡這種當初被罵慘的路線很難堅持下來。 這和偏執之間的差別是什么呢?也許是大處去“賭”,具體執行則極端理性,極其柔韌,極致務實。
哪怕那一手的獲勝概率極低,也理性選擇,認真走好。
一手棋的勝率是6%,一手棋是3%,雖然都一塌糊涂,但還是冷靜地選6%那一手。 而不是說,反正都很爛,選哪個不是一回事?然后破罐子破摔。 其實,這個時候才是真正考驗高手的時刻。
反過來說,不管一個人的處境多么困難,永遠會有相對較好的下一步。
這就是本文雞湯標題的并不雞湯之處。
這時候,與其哀怨,不如堅定地走出概率最優的一步。
最后
我們不僅要有“永遠都有最好的下一步”的樂觀,還需要評估當下可選項的理性,并選擇相對優的下一步。
AI不僅教會我們機器似的理性決策,還通過模仿人類大腦的方式,反過來提示我們,智能體如何通過強化學習越變越聰明。????
想想看,那正是我們小時候的樣子:大膽試錯,跌跌撞撞。???????
童年,是我們學習速度最驚人的歲月。???
那當然也是我們最快樂的歲月。????????
童年的我們,有一種“相信可能性”的勇敢。就像《愛麗絲夢游仙境》里的女孩,她有時候在早餐的時候會相信六件不可能的事情。
對可能性的信仰和智慧,正是本文想要表達的某種生命中最重要的品質:
基于小概率的100%的勇敢。
這絕非是孤注一擲,一切依然需要基于整體的正期望值。
當所有選項的正確概率都極低,仍然只選擇概率最高的路徑。
想和老喻聊聊嗎?
請加微信:four-feet-friend
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.