99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<samp id="rhuqp"></samp>

<del id="rhuqp"><ul id="rhuqp"><kbd id="rhuqp"></kbd></ul></del>

<thead id="rhuqp"><b id="rhuqp"></b></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

永遠都有最好的下一步

2023-07-20 11:13:14　來源: 孤獨大腦

北京舉報

0

分享至

一

和人最大的不同之處是，AI永遠不會說不。?????

這不止是說，當你給ChatGPT派任務時，它永遠會給你一個答案，哪怕是一本正經地胡說八道。

還因為，AI模型的工作方法很大程度上是基于概率：

“它們估計所有選項的概率，即使所有選項的正確概率都極低，它們仍然只會選擇概率最高的路徑。”

有人會說，這不是人之常情嗎？

面對兩個蘋果，傻子也會選大的呀。然而，兩個蘋果是確定性的，是眼見為實的。一旦變成概率，大多數人就不會了--

“什么是概率？一件事情發生了就是百分之百，沒發生就是零，哪里有什么30%啊，60%啊，根本不存在。”

更別說，還是兩個正確率都很低的概率。這時，即使是概率信徒，也會失去了選擇的力氣。

比方說，一個相信概率的人，可能會在70%和80%之間選后者。

但如果一個數值是3%，一個數值是5%，還有啥可選的？

如果希望僅為3%或5%，那就相當于毫無希望，根本沒有選的心情了。

我想將其稱為“決策厭惡癥”：

絕大多數人處在僅有“小概率可能”的環境里，就會放棄思考，失去向前選擇的動力，只想躺平。

想想看，當你遇見事情一團糟，或者做事條件不充分，未來毫無頭緒，哪里還有心情在一堆壞事里面，去找那件相對不那么壞的事情？

與人不一樣，AI永遠會行動，即使所有選項的正確概率都極低。

AI永遠會給你答案，哪怕一切模糊不清，“仍然只會選擇概率最高的路徑”。

而一旦以上動作可以迭代循環往復，就會產生驚人的智能。

只有特別厲害的人才會如AI一樣：

哪怕選項再糟糕，也會冷靜地選擇概率相對較大的那一項，然后全力以赴做好。

二

棋手卡帕布蘭卡說：“我只向前看一步，但總是正確的一步。”

這看起來有點兒奇怪，作為一名棋手，難道不應該向前計算很多步，高瞻遠矚，運籌帷幄，為什么只向前看一步呢？”?

的確，所有偉大的棋手，以及決策高手，都會比對手計算得更深遠，并且以終局勝利作為評價當下一手的價值標準。???

然而，即使如此，你也只用為接下來要走的那一步操心。????

以圍棋AI為例，它會計算幾個主要落子點的終局勝率，然后從中選擇勝率最高的那一手。?????????????

這是一個典型的馬爾可夫決策過程。????

馬爾可夫性質（或稱馬爾可夫性）是指一個隨機過程的未來狀態只依賴于當前狀態，而與過去的歷史狀態無關。簡單來說，這就是“無記憶性”。

在馬爾可夫鏈的每一步，系統根據概率分布，可以從一個狀態變到另一個狀態，也可以保持當前狀態。狀態的改變叫做轉移，與不同的狀態改變相關的概率叫做轉移概率。

下棋具有馬爾可夫性質。在這些游戲中，下一步的決策只需要考慮當前的棋局狀態，而無需考慮達到這個狀態之前的所有步驟。

換句話說，棋盤的當前狀態（即每個棋子的位置）包含了決定游戲未來走向的所有必要信息。

所以，可以說下棋游戲符合馬爾可夫性質，因為你不需要知道游戲是如何進行到當前這一步的。

只要知道當前棋盤上各個棋子的位置，就足以決定你的下一步棋應該怎么走。

1、面對未來，以終局為目標，但只操心下一步；

2、回望過去，壓縮可用價值，忘掉得失和情緒。

這才是活在當下的真義。

三

大神Stephen Wolfram談及，ChatGPT嘗試寫一篇文章時，基本上只是在猜：下一個單詞應該是什么？

我們假設已有文本為“人工智能最擅長的一點是...”，然后想象一下掃描數十億個人類編寫的文本（例如網絡內容和數字化書籍），找到所有這些文本的實例，看看下一個單詞出現的頻率是多少。這里概率最高的下一個英文單詞是學習（learn）。

如何計算這些概率呢？Wolfram介紹說：

大的想法就是制作一個模型，好的模型是與人類看法相一致的函數結果，這里就涉及到了神經網絡，它可以被認為是對大腦是如何工作的簡單理想化表達。

ChatGPT的神經網絡基于有數十億個權重的數學函數，根據它所看到的訓練內容，查看數十億頁的文本），“合理地”去猜下一個單詞。

所以，AI的“只看下一步”，不止是胸懷全局，還是一個強化學習的過程。?

在強化學習中，代理（agent）通過與環境交互，進行一系列的動作，從而嘗試最大化累積獎勵。

每個動作都會導致環境狀態的改變，每種狀態都有一個與之相關的獎勵。代理的目標是學習一種策略，該策略能夠根據當前的狀態確定應采取的最佳動作。

機器學習的訓練，令AI的預測越來越準。在與環境的交互過程中，智能體持續自我改進，不斷進化，進而實現了整體的更大回報。??????

從這個角度，更能理解胡先生說的--科學家明知真理無窮、知識無窮，但他們仍然有他們的滿足：

進一寸有一寸的愉快，進一尺有一尺的滿足。

四

選擇最接近的，而非追逐完美。

如笛卡兒所說：

當追隨真理超出了我們的能力時，我們應該追隨最可能是真理的東西。

笛卡爾的這句話，和AI的邏輯有些像。

我們總是生存于在混亂、不完備的狀況之中，如果我們總是糾結于要想明白，要條件充分，要明明白白，要大概率，那就寸步難行。

在已知條件下，找到對你的全局利益相對而言比較優的一手。

馬斯克提過類似的工作方法，他說，你應該設好大目標，別太擔心現在和目標之間的山高水長和種種殘缺，每次想好朝著目標的最優下一步即可。

大處堅定，小處靈活。辛頓也是一類人，不然神經網絡這種當初被罵慘的路線很難堅持下來。這和偏執之間的差別是什么呢？也許是大處去“賭”，具體執行則極端理性，極其柔韌，極致務實。

哪怕那一手的獲勝概率極低，也理性選擇，認真走好。

一手棋的勝率是6%，一手棋是3%，雖然都一塌糊涂，但還是冷靜地選6%那一手。而不是說，反正都很爛，選哪個不是一回事？然后破罐子破摔。其實，這個時候才是真正考驗高手的時刻。

反過來說，不管一個人的處境多么困難，永遠會有相對較好的下一步。

這就是本文雞湯標題的并不雞湯之處。

這時候，與其哀怨，不如堅定地走出概率最優的一步。

最后

我們不僅要有“永遠都有最好的下一步”的樂觀，還需要評估當下可選項的理性，并選擇相對優的下一步。

AI不僅教會我們機器似的理性決策，還通過模仿人類大腦的方式，反過來提示我們，智能體如何通過強化學習越變越聰明。????

想想看，那正是我們小時候的樣子：大膽試錯，跌跌撞撞。???????

童年，是我們學習速度最驚人的歲月。???

那當然也是我們最快樂的歲月。????????

童年的我們，有一種“相信可能性”的勇敢。就像《愛麗絲夢游仙境》里的女孩，她有時候在早餐的時候會相信六件不可能的事情。

對可能性的信仰和智慧，正是本文想要表達的某種生命中最重要的品質：

基于小概率的100%的勇敢。

這絕非是孤注一擲，一切依然需要基于整體的正期望值。

當所有選項的正確概率都極低，仍然只選擇概率最高的路徑。

想和老喻聊聊嗎？

請加微信：four-feet-friend

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

印度"首次承認"戰機被擊落：不是6架幾架并不重要

澎湃新聞 2025-06-01 08:03:26
11256 跟貼 11256
情緒價值拉滿！擔心游客趕不到海，大連一景區開鏟車日撒1000斤蜆子

極目新聞 2025-06-01 13:57:57
702 跟貼 702

今天凌晨，北京多區居民睡夢中被巨響驚醒！科學解釋來了

北京日報客戶端 2025-05-31 12:56:00
839 跟貼 839

10元門票炒到500，上座率超過職業聯賽！江蘇十三太保把足球踢“出圈”

藍鯨新聞 2025-06-01 18:28:42
259 跟貼 259
蘇超激戰！“醋壇子”大意翻了，鎮江圣象隊主場惜敗宿遷

揚子晚報 2025-06-01 11:54:56
415 跟貼 415

iPhone，又行了？

中國新聞周刊 2025-06-01 14:25:13
458 跟貼 458

以防長：辛瓦爾已死這些人是下個目標

央視新聞客戶端 2025-06-01 06:21:40
1867 跟貼 1867
雷軍發文，曬童年“三道杠”照片

魯中晨報 2025-06-01 10:21:25
268 跟貼 268

以7-5贏下搶七局，鄭欽文法網1/8決賽先下一城

魯中晨報 2025-06-01 21:29:07
29 跟貼 29
河南鶴壁一水庫水位下降驚現千佛石窟，石窟開鑿于東魏內有1043尊石佛，水庫管理方回應

極目新聞 2025-05-31 18:05:52
0 跟貼 0
C919有望成為波音客機的競爭者

極目新聞 2025-06-01 11:00:40
72 跟貼 72
福建平潭“瘦骨”駱駝1死1萎靡，多方回應

現代快報 2025-06-01 17:36:07
45 跟貼 45
兩年前還在抱著零食看比賽，兩年后直接亞洲第一！她說“太魔幻了”

魯中晨報 2025-06-01 09:41:13
484 跟貼 484
突然爆火！大批外國人來上海直奔這里，瘋狂掃貨，塞滿整個行李箱，店主“人均英語八級”

上觀新聞 2025-06-01 22:17:47
0 跟貼 0
9歲圍棋少年墜亡后續：死因曝光，父親名下多套房產，不認可家暴

奇思妙想草葉君 2025-06-01 23:55:18
0 跟貼 0
迪士尼疑因游客拍照順序起沖突，扭打時幼兒被推搡，媽媽崩潰大哭

奇思妙想草葉君 2025-06-01 23:49:27
0 跟貼 0
樊振東加盟德甲聯賽幕后：德國俱樂部稱一切來得太突然

澎湃新聞 2025-06-01 08:06:28
0 跟貼 0
英媒：斯塔默稱將恢復英國“戰備狀態”，提升武器產能至戰時水平

環球網資訊 2025-06-01 20:17:35
0 跟貼 0
廣州市中心“堵船”了！獵德村上演十年最大規模招景，150多條龍船穿越CBD，比過年還熱鬧

極目新聞 2025-06-01 08:52:53
0 跟貼 0
今起，江蘇電價新政正式實施

魯中晨報 2025-06-01 09:17:05
0 跟貼 0
開了四年的“特斯拉”，突然要花15萬換電池？車主：莫名其妙

瀟湘晨報 2025-06-01 11:07:20
0 跟貼 0
上海警方通報迪士尼打架事件

環球時報新聞 2025-06-01 23:55:21
0 跟貼 0
“7歲男孩放學途中遭3犬撕咬”引關注母親講述經過：孩子休學1年，即將第6次手術

紅星新聞 2025-06-01 23:45:11
0 跟貼 0

衛冕冠軍法網25連勝斯瓦泰克2-1逆轉萊巴金娜，本賽季3殺對手

衛冕冠軍法網25連勝斯瓦泰克2-1逆轉萊巴金娜，本賽季3殺對手

直播吧

2025-06-01 22:36:12

樊振東加盟德甲聯賽幕后：德國俱樂部稱一切來得太突然

樊振東加盟德甲聯賽幕后：德國俱樂部稱一切來得太突然

澎湃新聞

2025-06-01 08:06:28

連斬拜仁、巴薩后，歐冠決賽0-5慘敗巴黎，國米為何前后判若兩隊

連斬拜仁、巴薩后，歐冠決賽0-5慘敗巴黎，國米為何前后判若兩隊

體育世界

2025-06-01 15:12:53

生于1992年的她，追求低級趣味，嚴重違反黨的工作紀律、生活紀律，構成嚴重職務違法并涉嫌貪污犯罪

生于1992年的她，追求低級趣味，嚴重違反黨的工作紀律、生活紀律，構成嚴重職務違法并涉嫌貪污犯罪

新京報

2025-06-01 16:09:34

震驚！網傳合肥一陪酒小妹忽悠男顧客消費5600元之后爽約，被曝光

震驚！網傳合肥一陪酒小妹忽悠男顧客消費5600元之后爽約，被曝光

火山詩話

2025-06-01 19:01:14

重大轉變！特朗普，決定撤回！

證券時報

2025-06-01 19:02:11

5名中國公民在美國黃石公園附近因車禍遇難警方：肇事司機涉酒駕

5名中國公民在美國黃石公園附近因車禍遇難警方：肇事司機涉酒駕

新京報

2025-06-01 09:41:05

法網大冷！去年亞軍被扣1060分鄭欽文漁翁得利首進世界前4有戲

法網大冷！去年亞軍被扣1060分鄭欽文漁翁得利首進世界前4有戲

侃球熊弟

2025-06-01 19:36:05

八旬老人花105萬買基金虧了30萬，狀告銀行，法院判了！案涉產品曾為博時旗下百億爆款基金

八旬老人花105萬買基金虧了30萬，狀告銀行，法院判了！案涉產品曾為博時旗下百億爆款基金

紅星新聞

2025-06-01 16:53:24

日本揚言3小時摧毀俄太平洋艦隊，必要時將聯手烏克蘭奪回四島

日本揚言3小時摧毀俄太平洋艦隊，必要時將聯手烏克蘭奪回四島

史政先鋒

2025-06-01 13:35:21

重磅！央行罕見出手，央行7000億元“大放水”，背后藏著什么信號

重磅！央行罕見出手，央行7000億元“大放水”，背后藏著什么信號

魏家東

2025-06-01 08:31:16

烏軍空襲俄四大基地，宣布炸毀40多架軍機，普京會下令核反擊嗎？

烏軍空襲俄四大基地，宣布炸毀40多架軍機，普京會下令核反擊嗎？

第一軍情

2025-06-01 22:00:45

世界第4出局，8強決出2席：鄭欽文2-1創法網最佳，豪取360萬獎金

世界第4出局，8強決出2席：鄭欽文2-1創法網最佳，豪取360萬獎金

求球不落諦

2025-06-01 22:27:29

炸裂！一企業管理層內部發言曝光：要清理按時打卡的“劃水害蟲”

炸裂！一企業管理層內部發言曝光：要清理按時打卡的“劃水害蟲”

火山詩話

2025-05-31 11:00:34

選舉臨近韓國前總統們發聲　為候選人“站臺”都說些什么

選舉臨近韓國前總統們發聲　為候選人“站臺”都說些什么

新華社

2025-06-01 17:31:06

突發！黃金大劫案

子說一點

2025-06-01 18:21:25

污蔑！荷蘭防相妄稱中國想“偷”芯片

污蔑！荷蘭防相妄稱中國想“偷”芯片

看看新聞Knews

2025-06-01 14:24:10

鄭欽文逆天體能！激戰167分鐘后采訪“凡爾賽”：再打2盤也沒問題

鄭欽文逆天體能！激戰167分鐘后采訪“凡爾賽”：再打2盤也沒問題

我愛英超

2025-06-01 22:55:51

鋼琴泡沫破滅，貶值十倍無人問津

鋼琴泡沫破滅，貶值十倍無人問津

快刀財經

2025-05-07 22:12:59

這樣的哈佛大學，死了也罷！

難得君

2025-06-01 14:21:27

關于思考的思考

280文章數 2169關注度

往期回顧全部

科技要聞

熱搜！雷軍疑回應余承東

頭條要聞

高密化工廠爆炸當地自媒體發倡議:該廠是高密人的驕傲

頭條要聞

高密化工廠爆炸當地自媒體發倡議:該廠是高密人的驕傲

體育要聞

一邊倒的歐冠決賽，青春無敵的新科冠軍

娛樂要聞

等等小花給鄧超拍雜志插畫由小花繪制

財經要聞

油價繼續下跌？歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺穩居新勢力前三

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

親子

家居

公開課

軍事航空

數碼要聞

三星多款平板曝光，One UI 8.0測試版將覆蓋S22系列

親子要聞

變裝兒童角色免費領詞典筆，快帶上你的童話夢出發吧！

家居要聞

原木純白邂逅自然本真

暖色復古溫馨小資情調
開闊實用技術控的大平層
個性重塑現代潮酷之家

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

軍事要聞

美防長在香會大肆渲染中國威脅中方回應

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：客服| 昭苏县| 东丽区| 沙河市| 盈江县| 武川县| 桑植县| 宜阳县| 沛县| 乳源| 淳安县| 江津市| 吉木萨尔县| 南木林县| 西宁市| 自贡市| 江安县| 南江县| 平泉县| 拉孜县| 梓潼县| 峡江县| 邯郸县| 西乡县| 遂平县| 鄂托克旗| 临夏县| 阜康市| 哈巴河县| 疏附县| 彭水| 清镇市| 香格里拉县| 社会| 毕节市| 天全县| 凤阳县| 永川市| 长岭县| 浙江省| 灵台县|

<sub id="xkdvc"></sub>

^{<blockquote id="xkdvc"><rt id="xkdvc"></rt></blockquote>}

<sub id="xkdvc"><p id="xkdvc"></p></sub>