抓住風口
本期要點:AI為什么沒辦法像人一樣?
你好,我是王煜全,這里是王煜全要聞評論。
最近,盡管AI的發展如火如荼,但許多人可能會感到困惑——為什么是AI去寫詩畫畫,搶走程序員、分析師這樣的高端工作,而人類依舊需要自己洗衣做飯、端茶送水呢,不是說AI是來服務人類嗎?
現狀確實如此,不過,可能要有轉折了!
前段時間,一直對大語言模型(LLM)持批評態度的圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun),終于發布了“世界模型”的初步成果。
楊立昆詳細介紹了他們的新型視頻理解架構V-JEPA 2,即Video Joint Embedding Predictive Architecture。他強調,這不是另一個大語言模型的變種,而是基于海量視頻數據進行學習的“世界模型”。
據稱,V-JEPA 2的訓練分為兩個階段。首先,通過觀看視頻進行預訓練,讓模型建立對物體恒常性、重力、碰撞等物理概念的直覺。然后再引入機器人與環境互動的視頻數據進行微調,以提升模型的動作預測能力。
無獨有偶,被稱為“AI教母”的斯坦福大學教授李飛飛,在知名風投機構a16z的播客中提到,當前AI系統普遍缺乏一種至關重要的能力——空間智能(Spatial Intelligence)。
例如,當你蒙上眼睛,會發現很難僅憑語言完成復雜任務。但是睜開眼睛后,你能夠迅速構建物理空間并高效操作。對于AI及其控制的機器人來說也是同樣的道理。
我們認為,兩位路徑不同的頂尖學者共同給出了一個清晰的信號:大語言模型一定不是終點,AI的下一步應當是物理AI,也就是能夠感知、理解、推理乃至改變物理世界的模型。
不過,要注意的是,物理AI仍然無法實現通用人形機器人,最多只能創造出更靈巧的機械臂。今天的思想薈文章就來好好聊聊。
鸚鵡學舌
首先,世界模型和空間智能,或者用一個更大的概念——物理AI,確實是一個重大進步。
當前主流的AI模型都具有根本性缺陷。它們雖然“能說會道”,還能生成圖片、視頻,甚至可以為你完成一些具體的工作,但本質上這仍然只是“鸚鵡學舌”。
因為,說白了,當前主流生成式AI的底層原理是基于海量數據進行統計分析,從而預測下一個Token??墒牵捎谌狈ξ锢硎澜绶▌t的理解,它們的表現高度依賴于訓練數據的質量。
所以,我們會看到,當ChatGPT3.5剛推出時,盡管看上去能像人一樣聊天,但會頻繁出現幻覺和低級錯誤。而Sora等視頻生成工具也會產生不合物理規律的內容,比如讓椅子漂浮起來,或是讓螞蟻一會兒四條腿、一會兒六條腿。
這些問題確實可以優化,卻無法徹底消除。其根本原因在于,基于大語言模型的生成式AI無法自行評判結果準確與否。
楊立昆
因此,楊立昆和李飛飛所倡導的正是AI發展的下一步方向。
就像嬰兒通過看、聽和觸摸來探索世界,物理AI也可以通過多模態數據讓AI學習物理世界的規則,獲得自我判斷的能力。
AI也得“社會”
但是,從更長遠的角度看,物理AI也有局限性。
即便AI掌握了物理世界的規律,能夠像物理學家一樣思考,還能像工匠一樣進行精細的操作,但要讓它服務人,依然差著認知的鴻溝。
比如,服務人的AI應當至少具備情感共情的能力,也就是需要AI通過理解面部表情、語氣語調、生理信號等信息,感知人的情緒、想法,甚至預判人的動作。這是機器人剛剛開始涉足的領域,但卻是每個普通人的基本能力。
人類大腦中有豐富的鏡像神經元(Mirror Neuron),讓我們能夠直覺地感受到他人的喜怒哀樂?;谶@種理解,未來也許可以構建能和人共情的AI模型。
更重要的是,MIT的Rebecca Saxe等教授的研究表明,大腦中的顳頂聯合區,能讓我們直覺地理解他人的想法、推測他人的意圖。也就是說“子非魚”,確實“焉知魚之樂”,但我們都是人,甚至不需要學習就可以“知他人之樂”。如果AI要達到類似人類的認知水平,可能也需要具備類似的模塊和能力。
所以,雖然AI大模型可以識別諷刺、開玩笑等表達方式,但這是因為它們掌握了文本數據中的一些人類行為模式,并沒有內化社會互動背后的動機與情感。我們也就更不能指望AI會突然“開竅”,而是要對所謂的“涌現”現象持謹慎態度。
人是有自由意志的自主行為體,機器人要想服務好人,必須要對服務對象的思想和情緒有充分的了解,對人的行為能做出預判。而這些,甚至都還沒列到現階段AI研發的日程上來。
所以,最后,我想強調的是,我們距離實現真正的通用機器人,還有不少難關。
如今像特斯拉等公司大舉投資人形機器人,當然是看中了它的“通用性”。馬斯克自然不會希望自己的機器人只能在工廠擰螺絲,而是能在人類的生活環境中提供服務。也只有這樣,才能支撐他所說的“全球機器人數量將達到100億臺”的設想。
但這意味著,此時機器人不僅要會干活,還要能服務人。
可是,要注意,物理AI只能做到“會干活”。物理AI可以讓機器人拿起杯子,但無法讓機器人理解在何種情境下、以何種方式遞上這杯水。如果把沒有社會智能的機器人強行塞進人類社會,你就會發現,這些機器無法真正融入,也就不能提供服務。
當然,物理AI可以提升機械臂處理多樣化零件或完成復雜裝配任務的能力,比如裁剪衣服和組裝手機。這或許有助于進一步提高生產自動化水平,特別是在目前仍依賴人工的勞動密集型產業。
但僅僅讓機器人可以從事柔性生產,顯然意義并不重大。這只是替代了一小部分人工,也沒有產生新增的價值。尤其是用人形機器人,在工業生產的場景中,其性價比很難超越非人形的特定用途機器人。
那么,當機器人被證明無法勝任普遍需求時,一場“寒冬”可能就會到來。那些專注于按摩、做飯、工業生產等垂直領域的機器臂或機器手企業,反而可能存活下來,并在物理AI的賦能下成長為行業巨頭。
所以,我們反復強調,在技術熱潮中,坑往往比機會多。
只有那些真正理解底層規律但仍然謹慎樂觀的人,才能在泡沫中存活,并在蕭條中崛起。
以上就是今天的內容。在今晚的特訓營直播課上,我將為你深度剖析汽車產業的風險和機遇。如果你感興趣,現在購買或續費“前哨?科技特訓營”,還可額外獲贈2個月的學時!歡迎掃碼加入,和我一起,先人一步,領先一路!
另外,我們將每天的前哨科技新聞速覽轉化成AI播客,每天下午6點左右在全球風口的視頻號里播放,希望你在下班路上能輕松獲取科技新聞,歡迎前來試聽。
王煜全要聞評論,我們明天見。
↓長按圖片掃碼報名,先人一步,領先一路
最后,鑒于公眾號推送機制的改變,你未來刷到要聞評論的機會可能沒那么多了,建議你加入粉絲群,第一時間得到我的獨家前沿分析,而且我們還會每天在粉絲群里發布獨家資料,快快掃碼加入吧!
【科技特訓營】看懂科技產業,離不開長期觀察。線上書院模式,與王老師深度鏈接!為未來五年做好準備,先人一步,領先一路!
↓¥399,掌握王煜全AI產業預測精華(iOS用戶請在電腦端打開)
此外,我們還為您準備了一份思維導圖,掃描加群即可領取
“全球AI獨角獸一覽表”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.