我們聽過無數道理,卻仍然過不好這一生。
這是一句流行卻扎心的話。為什么會這樣?很多人歸因于“知行不合一”,但在我看來,還有一個更關鍵的原因:道理歸道理,現實歸現實。
換句話說,那些所謂的“道理”往往是脫離現實的。即便你能做到知行合一,也可能走不出困境。因為這些道理,本質上是基于前人經驗的總結,是過去的答案。
但拿著老地圖,是無法發現新大陸的。
讓人意外的是,當今最先進的人工智能,也正在重復這條“拿老地圖找新路”的老路。
近年來,人工智能依靠海量人類數據不斷取得突破。你還在驚嘆它們會寫詩、答題,它們已經能作畫、生成視頻,甚至完成訂機票、定酒店這樣的復雜任務。而各種“智能體”更是在各類應用中嶄露頭角。
但奇怪的是,我們并未看到這些大語言模型在真正意義上的數學、科學等領域有重大突破。相反,自 ChatGPT 推出兩年多以來,大模型的發展已顯疲態,進展放緩,迫切需要新的突破方向。(想象一下,GPT-4 已經是 2 年前的產品)
為什么?
一個核心原因是:用于訓練的高質量人類數據,已經接近耗盡。更深層的問題是:依賴人類數據的監督學習方法,已經觸及天花板。
而許多真正重要的創新——無論是數學定理、科學發現,還是技術發明——恰恰超出了現有人類知識的邊界,是任何“人類數據”都無法提供的。
難道 AGI 的夢想就此止步?
當然不是。問題的根源在于:雖然大語言模型的發展迅猛,但卻在關鍵時刻“誤入歧途”。
我們熟悉 AlphaGo 的故事。它最初靠大量人類棋譜訓練,迅速擊敗了人類棋手。令人驚嘆的是,它的繼任者 AlphaZero 徹底放棄了人類棋譜,只靠自己與自己對弈,通過不斷試錯、反復交互,演化出一整套新穎而高效的棋法,甚至反過來成為人類學習的對象。
這就是典型的“體驗式學習”。
不過,這種方式之所以一直未能走向主流,是因為它往往只在模擬環境中表現出色。現實世界遠比棋盤復雜多變,目標模糊、獎勵不明,而這正是傳統強化學習難以適應的原因。
于是,AI 研究轉向另一條路——以人類數據為核心的大語言模型。這條路在短時間內確實帶來了泛化能力的爆發,但也帶來了一個代價:
它造就的,是最聰明的模仿者,而非真正的創造者。
而人類歷史上的偉大突破,恰恰發生在無圖可循、無人可學的時刻。
正如一個剛畢業的學生,想要成長為真正優秀的工程師,課堂知識只是開始,必須要在真實項目中反復打磨、不斷試錯,才能真正形成經驗與洞察。這種不斷與現實互動、感知反饋、改進策略的過程,我們稱之為:體驗。
人工智能要邁入下一個階段,同樣必須走上這條“親身體驗”的道路。
而這,正是“體驗時代”即將帶來的變革核心:AI 將從人類數據中走出,轉向與環境交互、從經驗中學習的新路徑。
這不是空想。AlphaZero 已經證明了體驗式學習的潛力,而最近 DeepSeek 的工作也再次印證了強化學習的魅力——它不靠人類硬塞知識,而是設置好激勵,讓模型自己進化出高階的解決策略。
強化學習的核心是什么?就是通過不斷與環境互動、試錯調整來實現目標。這套思維方式,才是真正讓 AI 自主成長、突破人類經驗邊界的鑰匙。
而現在,它終于等來了屬于自己的舞臺。
因為今天的 AI,已經初步具備了自主探索現實世界的能力。智能體正在以驚人的速度進化,它們可以自己搜索網頁、控制鼠標、操控系統,甚至在虛擬設備中動手做實驗。
與此同時,強化學習算法本身也在快速升級,能夠支持更復雜的推理與規劃能力。
于是,AI 即將從一個“問答式工具”,變成一個“持續成長的智慧體”。
它將擁有一條真正的“生命之流”——像人一樣積累記憶、不斷適應環境。例如健康助手可以長期追蹤用戶的身體狀態;科研 AI 則能長時間運行實驗、積累結果、推導模型。
這種連續性的“體驗流”,正是當前碎片化大模型最欠缺的能力。
更重要的是,體驗時代中的 AI 不再只是“聽話”的輸入輸出工具,而是可以觀察世界、操作世界,并從后果中學習的自主體。
它們將不再依賴人類反饋打分,而是以現實世界的反饋作為學習信號——比如心率變化、分數提升、銷量數據等,直接用“發生了什么”來判斷“做得如何”。
這將讓 AI 真正成為一個在現實中成長的生命體。
體驗式 AI 還有一個天然的優點:它能夠修正自己的目標。
不像早期系統“一旦設錯目標就一條路走到黑”,具備環境感知與反饋調節能力的 AI,更像人類那樣,能隨著經驗及時調整方向。哪怕出錯了,也能“撞南墻后回頭”。(想想那個超級回形針的問題)
簡而言之:AI 終于可以像科學家、工程師、學生一樣,從世界中學習,在現實中進化。
而隨著“體驗式學習”與“強化學習算法”的融合,AI 也將邁向真正的“超人類智能”。
這個新時代,已經悄然到來。
【參考】
Welcome to the Era of Experience:https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf
本文由「AI 范兒」出品
我每天都在更新,如果你覺得這些內容對你有用,
那我們就加個關注、交個朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.