99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

永遠都有最好的下一步

0
分享至

和人最大的不同之處是,AI永遠不會說不。?????

這不止是說,當你給ChatGPT派任務時,它永遠會給你一個答案,哪怕是一本正經地胡說八道。

還因為,AI模型的工作方法很大程度上是基于概率:

“它們估計所有選項的概率,即使所有選項的正確概率都極低,它們仍然只會選擇概率最高的路徑。”

有人會說,這不是人之常情嗎?

面對兩個蘋果,傻子也會選大的呀。 然而,兩個蘋果是確定性的,是眼見為實的。 一旦變成概率,大多數人就不會了--

“什么是概率?一件事情發生了就是百分之百,沒發生就是零,哪里有什么30%啊,60%啊,根本不存在。”

更別說,還是兩個正確率都很低的概率。這時,即使是概率信徒,也會失去了選擇的力氣。

比方說,一個相信概率的人,可能會在70%80%之間選后者。

但如果一個數值是3%,一個數值是5%,還有啥可選的?

如果希望僅為3%或5%,那就相當于毫無希望,根本沒有選的心情了。

我想將其稱為“決策厭惡癥”:

絕大多數人處在僅有“小概率可能”的環境里,就會放棄思考,失去向前選擇的動力,只想躺平。

想想看,當你遇見事情一團糟,或者做事條件不充分,未來毫無頭緒,哪里還有心情在一堆壞事里面,去找那件相對不那么壞的事情?

與人不一樣,AI永遠會行動,即使所有選項的正確概率都極低。

AI永遠會給你答案,哪怕一切模糊不清,“仍然只會選擇概率最高的路徑”。

而一旦以上動作可以迭代循環往復,就會產生驚人的智能。

只有特別厲害的人才會如AI一樣:

哪怕選項再糟糕,也會冷靜地選擇概率相對較大的那一項,然后全力以赴做好。

棋手卡帕布蘭卡說:“我只向前看一步,但總是正確的一步。”

這看起來有點兒奇怪,作為一名棋手,難道不應該向前計算很多步,高瞻遠矚,運籌帷幄,為什么只向前看一步呢?”?

的確,所有偉大的棋手,以及決策高手,都會比對手計算得更深遠,并且以終局勝利作為評價當下一手的價值標準。???

然而,即使如此,你也只用為接下來要走的那一步操心。????

以圍棋AI為例,它會計算幾個主要落子點的終局勝率,然后從中選擇勝率最高的那一手。?????????????

這是一個典型的馬爾可夫決策過程。????

馬爾可夫性質(或稱馬爾可夫性)是指一個隨機過程的未來狀態只依賴于當前狀態,而與過去的歷史狀態無關。簡單來說,這就是“無記憶性”。

在馬爾可夫鏈的每一步,系統根據概率分布,可以從一個狀態變到另一個狀態,也可以保持當前狀態。狀態的改變叫做轉移,與不同的狀態改變相關的概率叫做轉移概率。


下棋具有馬爾可夫性質。在這些游戲中,下一步的決策只需要考慮當前的棋局狀態,而無需考慮達到這個狀態之前的所有步驟。

換句話說,棋盤的當前狀態(即每個棋子的位置)包含了決定游戲未來走向的所有必要信息。

所以,可以說下棋游戲符合馬爾可夫性質,因為你不需要知道游戲是如何進行到當前這一步的。

只要知道當前棋盤上各個棋子的位置,就足以決定你的下一步棋應該怎么走。

1、面對未來,以終局為目標,但只操心下一步;

2、回望過去,壓縮可用價值,忘掉得失和情緒。

這才是活在當下的真義。

大神Stephen Wolfram談及,ChatGPT嘗試寫一篇文章時,基本上只是在猜:下一個單詞應該是什么

我們假設已有文本為“人工智能最擅長的一點是...”,然后想象一下掃描數十億個人類編寫的文本(例如網絡內容和數字化書籍),找到所有這些文本的實例,看看下一個單詞出現的頻率是多少。這里概率最高的下一個英文單詞是學習(learn)。

如何計算這些概率呢?Wolfram介紹說:

大的想法就是制作一個模型,好的模型是與人類看法相一致的函數結果,這里就涉及到了神經網絡,它可以被認為是對大腦是如何工作的簡單理想化表達。

ChatGPT的神經網絡基于有數十億個權重的數學函數,根據它所看到的訓練內容,查看數十億頁的文本),“合理地”去猜下一個單詞。

所以,AI的“只看下一步”,不止是胸懷全局,還是一個強化學習的過程。?

在強化學習中,代理(agent)通過與環境交互,進行一系列的動作,從而嘗試最大化累積獎勵。

每個動作都會導致環境狀態的改變,每種狀態都有一個與之相關的獎勵。代理的目標是學習一種策略,該策略能夠根據當前的狀態確定應采取的最佳動作。


機器學習的訓練,令AI的預測越來越準。在與環境的交互過程中,智能體持續自我改進,不斷進化,進而實現了整體的更大回報。??????

從這個角度,更能理解胡先生說的--科學家明知真理無窮、知識無窮,但他們仍然有他們的滿足:

進一寸有一寸的愉快,進一尺有一尺的滿足。

選擇最接近的,而非追逐完美。

如笛卡兒所說:

當追隨真理超出了我們的能力時,我們應該追隨最可能是真理的東西。

笛卡爾的這句話,和AI的邏輯有些像。

我們總是生存于在混亂、不完備的狀況之中,如果我們總是糾結于要想明白,要條件充分,要明明白白,要大概率,那就寸步難行。

在已知條件下,找到對你的全局利益相對而言比較優的一手。

馬斯克提過類似的工作方法,他說,你應該設好大目標,別太擔心現在和目標之間的山高水長和種種殘缺,每次想好朝著目標的最優下一步即可。

大處堅定,小處靈活。 辛頓也是一類人,不然神經網絡這種當初被罵慘的路線很難堅持下來。 這和偏執之間的差別是什么呢?也許是大處去“賭”,具體執行則極端理性,極其柔韌,極致務實。

哪怕那一手的獲勝概率極低,也理性選擇,認真走好。

一手棋的勝率是6%,一手棋是3%,雖然都一塌糊涂,但還是冷靜地選6%那一手。 而不是說,反正都很爛,選哪個不是一回事?然后破罐子破摔。 其實,這個時候才是真正考驗高手的時刻。

反過來說,不管一個人的處境多么困難,永遠會有相對較好的下一步。

這就是本文雞湯標題的并不雞湯之處。

這時候,與其哀怨,不如堅定地走出概率最優的一步。

最后

我們不僅要有“永遠都有最好的下一步”的樂觀,還需要評估當下可選項的理性,并選擇相對優的下一步。

AI不僅教會我們機器似的理性決策,還通過模仿人類大腦的方式,反過來提示我們,智能體如何通過強化學習越變越聰明。????

想想看,那正是我們小時候的樣子:大膽試錯,跌跌撞撞。???????

童年,是我們學習速度最驚人的歲月。???

那當然也是我們最快樂的歲月。????????

童年的我們,有一種“相信可能性”的勇敢。就像《愛麗絲夢游仙境》里的女孩,她有時候在早餐的時候會相信六件不可能的事情。

對可能性的信仰和智慧,正是本文想要表達的某種生命中最重要的品質:

基于小概率的100%的勇敢。

這絕非是孤注一擲,一切依然需要基于整體的正期望值。

當所有選項的正確概率都極低,仍然只選擇概率最高的路徑。

想和老喻聊聊嗎?

請加微信:four-feet-friend

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
衛冕冠軍法網25連勝斯瓦泰克2-1逆轉萊巴金娜,本賽季3殺對手

衛冕冠軍法網25連勝斯瓦泰克2-1逆轉萊巴金娜,本賽季3殺對手

直播吧
2025-06-01 22:36:12
樊振東加盟德甲聯賽幕后:德國俱樂部稱一切來得太突然

樊振東加盟德甲聯賽幕后:德國俱樂部稱一切來得太突然

澎湃新聞
2025-06-01 08:06:28
連斬拜仁、巴薩后,歐冠決賽0-5慘敗巴黎,國米為何前后判若兩隊

連斬拜仁、巴薩后,歐冠決賽0-5慘敗巴黎,國米為何前后判若兩隊

體育世界
2025-06-01 15:12:53
生于1992年的她,追求低級趣味,嚴重違反黨的工作紀律、生活紀律,構成嚴重職務違法并涉嫌貪污犯罪

生于1992年的她,追求低級趣味,嚴重違反黨的工作紀律、生活紀律,構成嚴重職務違法并涉嫌貪污犯罪

新京報
2025-06-01 16:09:34
震驚!網傳合肥一陪酒小妹忽悠男顧客消費5600元之后爽約,被曝光

震驚!網傳合肥一陪酒小妹忽悠男顧客消費5600元之后爽約,被曝光

火山詩話
2025-06-01 19:01:14
重大轉變!特朗普,決定撤回!

重大轉變!特朗普,決定撤回!

證券時報
2025-06-01 19:02:11
5名中國公民在美國黃石公園附近因車禍遇難 警方:肇事司機涉酒駕

5名中國公民在美國黃石公園附近因車禍遇難 警方:肇事司機涉酒駕

新京報
2025-06-01 09:41:05
法網大冷!去年亞軍被扣1060分 鄭欽文漁翁得利 首進世界前4有戲

法網大冷!去年亞軍被扣1060分 鄭欽文漁翁得利 首進世界前4有戲

侃球熊弟
2025-06-01 19:36:05
八旬老人花105萬買基金虧了30萬,狀告銀行,法院判了!案涉產品曾為博時旗下百億爆款基金

八旬老人花105萬買基金虧了30萬,狀告銀行,法院判了!案涉產品曾為博時旗下百億爆款基金

紅星新聞
2025-06-01 16:53:24
日本揚言3小時摧毀俄太平洋艦隊,必要時將聯手烏克蘭奪回四島

日本揚言3小時摧毀俄太平洋艦隊,必要時將聯手烏克蘭奪回四島

史政先鋒
2025-06-01 13:35:21
重磅!央行罕見出手,央行7000億元“大放水”,背后藏著什么信號

重磅!央行罕見出手,央行7000億元“大放水”,背后藏著什么信號

魏家東
2025-06-01 08:31:16
烏軍空襲俄四大基地,宣布炸毀40多架軍機,普京會下令核反擊嗎?

烏軍空襲俄四大基地,宣布炸毀40多架軍機,普京會下令核反擊嗎?

第一軍情
2025-06-01 22:00:45
世界第4出局,8強決出2席:鄭欽文2-1創法網最佳,豪取360萬獎金

世界第4出局,8強決出2席:鄭欽文2-1創法網最佳,豪取360萬獎金

求球不落諦
2025-06-01 22:27:29
炸裂!一企業管理層內部發言曝光:要清理按時打卡的“劃水害蟲”

炸裂!一企業管理層內部發言曝光:要清理按時打卡的“劃水害蟲”

火山詩話
2025-05-31 11:00:34
選舉臨近韓國前總統們發聲 為候選人“站臺”都說些什么

選舉臨近韓國前總統們發聲 為候選人“站臺”都說些什么

新華社
2025-06-01 17:31:06
突發!黃金大劫案

突發!黃金大劫案

子說一點
2025-06-01 18:21:25
污蔑!荷蘭防相妄稱中國想“偷”芯片

污蔑!荷蘭防相妄稱中國想“偷”芯片

看看新聞Knews
2025-06-01 14:24:10
鄭欽文逆天體能!激戰167分鐘后采訪“凡爾賽”:再打2盤也沒問題

鄭欽文逆天體能!激戰167分鐘后采訪“凡爾賽”:再打2盤也沒問題

我愛英超
2025-06-01 22:55:51
鋼琴泡沫破滅,貶值十倍無人問津

鋼琴泡沫破滅,貶值十倍無人問津

快刀財經
2025-05-07 22:12:59
這樣的哈佛大學,死了也罷!

這樣的哈佛大學,死了也罷!

難得君
2025-06-01 14:21:27
2025-06-02 00:24:49
孤獨大腦 incentive-icons
孤獨大腦
關于思考的思考
280文章數 2169關注度
往期回顧 全部

科技要聞

熱搜!雷軍疑回應余承東

頭條要聞

高密化工廠爆炸 當地自媒體發倡議:該廠是高密人的驕傲

頭條要聞

高密化工廠爆炸 當地自媒體發倡議:該廠是高密人的驕傲

體育要聞

一邊倒的歐冠決賽,青春無敵的新科冠軍

娛樂要聞

等等小花給鄧超拍雜志 插畫由小花繪制

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

數碼
親子
家居
公開課
軍事航空

數碼要聞

三星多款平板曝光,One UI 8.0測試版將覆蓋S22系列

親子要聞

變裝兒童角色免費領詞典筆,快帶上你的童話夢出發吧!

家居要聞

原木純白 邂逅自然本真

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長在香會大肆渲染中國威脅 中方回應

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 客服| 昭苏县| 东丽区| 沙河市| 盈江县| 武川县| 桑植县| 宜阳县| 沛县| 乳源| 淳安县| 江津市| 吉木萨尔县| 南木林县| 西宁市| 自贡市| 江安县| 南江县| 平泉县| 拉孜县| 梓潼县| 峡江县| 邯郸县| 西乡县| 遂平县| 鄂托克旗| 临夏县| 阜康市| 哈巴河县| 疏附县| 彭水| 清镇市| 香格里拉县| 社会| 毕节市| 天全县| 凤阳县| 永川市| 长岭县| 浙江省| 灵台县|