未經(jīng)許可不得轉(zhuǎn)載,務(wù)必保留原文出處鏈接和公眾號(hào)按鈕
(關(guān)注本城公眾號(hào)并設(shè)為星標(biāo),
第一時(shí)間獲取最新頂級(jí)商業(yè)科技認(rèn)知)
https://www.youtube.com/watch?v=hM_h0UA7upI
文:天空之城 ·城主
在這場(chǎng)最新的面對(duì)面訪談中,AI領(lǐng)域的大神級(jí)人物Andrej Karpathy與NoPriors投資播客展開了一場(chǎng)關(guān)于人工智能現(xiàn)狀和未來發(fā)展,及其對(duì)教育和認(rèn)知影響的深度探討。Karpathy憑借其在OpenAI、特斯拉等頂尖科技公司的豐富經(jīng)驗(yàn),輸出了獨(dú)特而深刻的見解。
訪談涵蓋了廣泛的主題,從自動(dòng)駕駛技術(shù)的現(xiàn)狀和未來,到AI研究的最新進(jìn)展;從大語言模型的發(fā)展?jié)摿Γ紸I在教育領(lǐng)域的革命性應(yīng)用;從人機(jī)融合的可能性,到AI對(duì)人類認(rèn)知和學(xué)習(xí)方式的深遠(yuǎn)影響。
Karpathy強(qiáng)調(diào)了AI不應(yīng)該是取代人類,而是應(yīng)該成為賦能人類的工具。他深入探討了AI研究的技術(shù)細(xì)節(jié),包括Transformer架構(gòu)的重要性、合成數(shù)據(jù)的潛力與挑戰(zhàn)、小型高效模型的發(fā)展前景等。在教育方面,Karpathy正在開發(fā)一個(gè)創(chuàng)新的AI驅(qū)動(dòng)的教育平臺(tái),旨在為全球每個(gè)人提供高質(zhì)量、個(gè)性化的教育體驗(yàn)。他對(duì)AI在改變學(xué)習(xí)動(dòng)機(jī)、打破傳統(tǒng)教育壁壘方面的潛力表示樂觀。
自從OpenAI離職全心搞AI教育后,這是Andrej第一次出來專訪,對(duì)于關(guān)心Andrej的同學(xué)們來說,這個(gè)訪談已經(jīng)等太久了。
B站傳送:【精校】AI大神Andrej Karpathy最新九月面對(duì)面訪談@NoPriors 【中英字幕】】
https://b23.tv/KZe39ww
本次訪談的重點(diǎn)內(nèi)容:
自動(dòng)駕駛技術(shù)的現(xiàn)狀與未來:
Karpathy認(rèn)為特斯拉在解決軟件問題方面處于領(lǐng)先地位,而Waymo則面臨硬件挑戰(zhàn)。他預(yù)測(cè)特斯拉將在長期內(nèi)占據(jù)優(yōu)勢(shì),因?yàn)檐浖栴}相對(duì)更容易解決。自動(dòng)駕駛技術(shù)從演示到實(shí)際產(chǎn)品化經(jīng)歷了漫長的十年,但仍未實(shí)現(xiàn)真正的全球化。Karpathy認(rèn)為自動(dòng)駕駛領(lǐng)域的進(jìn)展可以類比于AGI(通用人工智能)的發(fā)展。
AI研究的現(xiàn)狀與趨勢(shì):
Transformer架構(gòu)被視為重大突破,它解決了之前神經(jīng)網(wǎng)絡(luò)架構(gòu)的許多限制。當(dāng)前研究重點(diǎn)已轉(zhuǎn)向數(shù)據(jù)集和損失函數(shù)的創(chuàng)新,而不是架構(gòu)本身。合成數(shù)據(jù)在AI訓(xùn)練中被視為未來趨勢(shì),但需要小心處理以避免模型退化。Karpathy預(yù)測(cè),未來的AI模型可能會(huì)更小、更高效,甚至可能只需10億參數(shù)就能實(shí)現(xiàn)強(qiáng)大的認(rèn)知功能。
合成數(shù)據(jù)與AI訓(xùn)練:
合成數(shù)據(jù)被視為解決AI訓(xùn)練數(shù)據(jù)不足問題的重要方法。然而Karpathy警告說,使用合成數(shù)據(jù)時(shí)需要謹(jǐn)慎,以避免模型的隱性退化。他提出了在合成數(shù)據(jù)中注入熵的重要性,以保持?jǐn)?shù)據(jù)的多樣性和豐富性。
小型高效模型的未來:
Karpathy預(yù)測(cè),未來可能會(huì)出現(xiàn)參數(shù)量大大減少但功能強(qiáng)大的AI模型。他認(rèn)為,當(dāng)前的大型模型可能浪費(fèi)了大量容量來記憶不重要的信息。未來的AI系統(tǒng)可能更像是一個(gè)由多個(gè)專門化小模型組成的"生態(tài)系統(tǒng)",而不是單一的大模型。
AI在教育領(lǐng)域的革命性應(yīng)用,教育動(dòng)機(jī)和未來方向:
Karpathy正在開發(fā)一個(gè)以AI為基礎(chǔ)的全球化教育平臺(tái),旨在為每個(gè)人提供高質(zhì)量的個(gè)性化教育。他認(rèn)為AI可以實(shí)現(xiàn)教育的真正個(gè)性化,適應(yīng)不同學(xué)習(xí)者的背景和需求。AI教育助手可以扮演類似于個(gè)人導(dǎo)師的角色,大幅提高學(xué)習(xí)效率。Karpathy認(rèn)為教育不應(yīng)該僅僅是娛樂,而應(yīng)該是一種挑戰(zhàn)性的、塑造思維的過程。
談話探討了AI如何改變學(xué)習(xí)動(dòng)機(jī),以及在后AGI時(shí)代,教育可能更多地成為一種娛樂和自我提升的方式。Karpathy強(qiáng)調(diào)了文化環(huán)境對(duì)學(xué)習(xí)動(dòng)機(jī)和職業(yè)選擇的重要影響。他希望AI教育能夠打破傳統(tǒng)的精英主義和血統(tǒng)觀念,使高質(zhì)量教育更加民主化。
Karpathy強(qiáng)調(diào),數(shù)學(xué)、物理和計(jì)算機(jī)科學(xué)仍將是塑造思維能力的核心學(xué)科,對(duì)于未來世界至關(guān)重要。他建議年輕人應(yīng)該專注于培養(yǎng)解決問題的能力和邏輯思維,而不是僅僅積累知識(shí)。Karpathy預(yù)見未來的教育將更加靈活,人們會(huì)更頻繁地回到"學(xué)校"學(xué)習(xí)新技能。
-=Web3天空之城書面全文版(1.6萬字)=-
NoPriors:
今天我們和 Andrej Karpathy 一起聊天,他不需要再多介紹。Andrej 是著名的研究員,備受喜愛的人工智能教育家,是 OpenAI 的早期團(tuán)隊(duì)成員,曾擔(dān)任特斯拉 Autopilot 的負(fù)責(zé)人,現(xiàn)在致力于教育領(lǐng)域的人工智能。我們將與他討論研究現(xiàn)狀,他的新公司,以及我們對(duì)人工智能的期望。
非常感謝你今天加入我們,很高興你能來。
Andrej:
謝謝,我很高興來到這里。
NoPriors:
你曾領(lǐng)導(dǎo)特斯拉的 Autopilot,現(xiàn)在我們確實(shí)有了完全自動(dòng)駕駛的汽車,道路上的乘用車。你如何看待當(dāng)前的能力集,我們應(yīng)該多快看到能力的提升或普及的乘用車?
Andrej:
是的,我在自動(dòng)駕駛領(lǐng)域可能花了大約五年的時(shí)間。我認(rèn)為這是一個(gè)迷人的領(lǐng)域。目前在這個(gè)領(lǐng)域發(fā)生的事情是,我確實(shí)認(rèn)為我會(huì)從自動(dòng)駕駛中找到很多類比,我會(huì)說,類似于 AGI,而這可能是因?yàn)槲沂煜み@個(gè)領(lǐng)域。但我有點(diǎn)覺得我們?cè)谧詣?dòng)駕駛方面已經(jīng)有一點(diǎn)達(dá)到了 AGI,因?yàn)楝F(xiàn)在有一些系統(tǒng),你可以基本上帶著它們四處轉(zhuǎn)轉(zhuǎn),并作為付費(fèi)客戶使用。在舊金山,Waymo 當(dāng)然非常常見。你可能也坐過 Waymo。我坐過很多次,非常驚人,它可以帶你四處轉(zhuǎn)轉(zhuǎn),而你是以產(chǎn)品的形式付費(fèi)的。
有趣的是,我第一次坐 Waymo 實(shí)際上是十年前,幾乎正好是2014年左右。是一位在那兒工作的朋友給我做了一個(gè)演示。十年前它帶我繞著街區(qū)開了一圈,基本上是一次完美的駕駛。花了十年從我看到的演示變成一個(gè)我可以付費(fèi)使用的產(chǎn)品,而且是在城市規(guī)模內(nèi)擴(kuò)展,等等。
NoPriors:
你認(rèn)為其中有多少是由于監(jiān)管因素,而多大程度是技術(shù)因素?你認(rèn)為技術(shù)什么時(shí)候準(zhǔn)備好?是最近嗎?
Andrej:
我認(rèn)為是技術(shù)。你不可能在30分鐘的一次演示駕駛中看到全部情況。你不會(huì)遇到他們十年來必須應(yīng)對(duì)的所有問題。所以演示和產(chǎn)品之間存在巨大的差距。我認(rèn)為其中很多與法規(guī)等方面有關(guān)。但我確實(shí)認(rèn)為,我們?cè)谶@種意義上在自動(dòng)駕駛領(lǐng)域達(dá)到了 AGI 的一點(diǎn)點(diǎn)成就。盡管如此,我認(rèn)為真正令人著迷的是全球化根本沒有發(fā)生。所以你有一個(gè)演示,你可以在南方使用它,但世界還沒有改變。這需要很長時(shí)間。所以從演示到實(shí)際全球化,我認(rèn)為那里還有個(gè)巨大差距。我會(huì)說,這與 AGI 相關(guān),因?yàn)槲覒岩僧?dāng)我們得到 AGI 時(shí),它看起來會(huì)很相似。在自動(dòng)駕駛領(lǐng)域,人們普遍認(rèn)為Waymo領(lǐng)先于Tesla。但我個(gè)人認(rèn)為,Tesla實(shí)際上領(lǐng)先于Waymo。盡管這看起來并非如此,但我對(duì)特斯拉及其自動(dòng)駕駛計(jì)劃非常看好。
我認(rèn)為特斯拉面臨的是軟件問題,而Waymo面臨的是硬件問題。在我看來,軟件問題要容易解決得多。特斯拉已經(jīng)在全球部署了大量汽車,規(guī)模宏大,而我認(rèn)為Waymo需要達(dá)到這一點(diǎn)。因此,一旦特斯拉能夠真正部署并且正常工作,我認(rèn)為這將是非常令人難以置信的。
我昨天剛試駕了最新版本的特斯拉自動(dòng)駕駛系統(tǒng),現(xiàn)在它已經(jīng)可以把我?guī)У饺魏蔚胤搅恕N也坏貌徽f,他們最近有了非常好的改進(jìn)。是的,我最近一直在使用它,它實(shí)際上運(yùn)行得相當(dāng)好。昨天它為我完成了一次神奇的駕駛,所以我對(duì)團(tuán)隊(duì)的工作印象深刻。
所以我仍然認(rèn)為特斯拉主要面臨的是軟件問題,而Waymo主要面臨的是硬件問題。雖然目前看起來Waymo有些領(lǐng)先,但我認(rèn)為當(dāng)我們?cè)?0年后回顧時(shí),誰真正實(shí)現(xiàn)了規(guī)模化,誰的收入來源最多,從這個(gè)角度來看,我仍然認(rèn)為特斯拉領(lǐng)先。
NoPriors:
你認(rèn)為我們離解決軟件問題的轉(zhuǎn)折點(diǎn)有多遠(yuǎn),何時(shí)才能達(dá)到某種程度的相等性?
顯然,如果你看Waymo的車,它有很多非常昂貴的LiDAR和其他傳感器,這些傳感器支持了其軟件系統(tǒng)。而特斯拉的方法是只用攝像頭,這樣可以有效地去除大量的成本和復(fù)雜性,并且可以應(yīng)用于多種不同類型的車。你認(rèn)為這種轉(zhuǎn)變什么時(shí)候會(huì)發(fā)生?
Andrej:
希望在未來幾年左右。
但實(shí)際上,真正有趣的是,我不確定人們是否意識(shí)到特斯拉其實(shí)也使用了很多昂貴的傳感器。他們只是在訓(xùn)練時(shí)使用這些傳感器。所以有一堆裝有LiDAR的車子在行駛。他們做了許多無法擴(kuò)展的事情,還有額外的傳感器等等。他們進(jìn)行地圖繪制和所有這些工作。在訓(xùn)練階段完成這些工作,然后將其濃縮成一個(gè)部署到車上的僅基于視覺的測(cè)試包。這就像是在傳感器和成本上的套利。
我認(rèn)為這實(shí)際上是一種很聰明的策略,但還沒有被充分理解。我認(rèn)為這會(huì)有很好的效果,因?yàn)橄袼匾呀?jīng)包含了信息。我認(rèn)為網(wǎng)絡(luò)會(huì)有能力做到這一點(diǎn)。在訓(xùn)練階段,這些傳感器確實(shí)有用,但在測(cè)試階段它們并不那么有用。
NoPriors:
似乎另一個(gè)正在發(fā)生的轉(zhuǎn)變是從許多邊界情況設(shè)計(jì)啟發(fā)式方法向端到端深度學(xué)習(xí)的轉(zhuǎn)變。這就是最近發(fā)生的另一個(gè)轉(zhuǎn)變。你要談?wù)勥@個(gè)問題,并且介紹一下這個(gè)嗎?
Andrej:
是的,我認(rèn)為這一直是特斯拉從一開始就計(jì)劃好的。我在談?wù)撋窠?jīng)網(wǎng)絡(luò)如何能夠逐步取代整個(gè)棧。因?yàn)楫?dāng)我加入時(shí),有大量的C++代碼。而現(xiàn)在,在車上運(yùn)行的測(cè)試包中,C++代碼已經(jīng)少了很多。我們沒有談?wù)摵蠖说哪切┐罅績?nèi)容,神經(jīng)網(wǎng)絡(luò)有點(diǎn)像穿過系統(tǒng)。
首先,它只是在圖像層面做檢測(cè)。然后它處理多張圖像,給你一個(gè)預(yù)測(cè)。隨著時(shí)間的推移,多個(gè)圖像給你一個(gè)預(yù)測(cè)。你正在丟棄C++代碼,最終只是發(fā)出轉(zhuǎn)向命令。所以我認(rèn)為特斯拉是在逐步取代整個(gè)棧。
我的理解是現(xiàn)在的Waymo實(shí)際上不是這樣,他們嘗試過,但最終沒有實(shí)現(xiàn),這是我目前的理解。但我不確定,因?yàn)樗麄儧]有談?wù)撨@個(gè)問題。但我從根本上相信這種方法。如果你這樣考慮的話,我認(rèn)為這是最后一塊拼圖。
我確實(shí)懷疑,像特斯拉這樣的端到端系統(tǒng)在大約10年內(nèi),就是一個(gè)神經(jīng)網(wǎng)絡(luò)。意思是,視頻流進(jìn)入一個(gè)神經(jīng)網(wǎng)絡(luò),然后輸出指令。你必須逐步建立起來,一步步來。即使所有的中間預(yù)測(cè)和我們所做的所有事情,我認(rèn)為它們實(shí)際上并沒有誤導(dǎo)開發(fā)。我認(rèn)為它們是其中的一部分,因?yàn)檫@有很多微妙的原因。
實(shí)際上,像端到端駕駛,當(dāng)你只是模仿人類等行為時(shí),你用很少的監(jiān)督信息來訓(xùn)練一個(gè)龐大的神經(jīng)網(wǎng)絡(luò)。訓(xùn)練這么多億個(gè)參數(shù)信號(hào)太少了。所以這些中間表示等有助于你開發(fā)所有特征和檢測(cè)器,然后讓端到端的部分問題變得容易得多。
所以我懷疑,雖然我不確定,因?yàn)槲也皇菆F(tuán)隊(duì)的一員,但有大量的預(yù)訓(xùn)練正在進(jìn)行,以便你可以進(jìn)行端到端的微調(diào)。所以基本上,我覺得有必要逐步地推進(jìn)。這就是特斯拉所做的。我認(rèn)為這是正確的方法。看起來它正在發(fā)揮作用。所以我真的很期待。
NoPriors:
如果你從頭到尾開始做,你無論如何都不會(huì)有數(shù)據(jù)。這說得通。
你離開之前在特斯拉的人形機(jī)器人項(xiàng)目上做過工作。我有很多問題,其中一個(gè)是從這里開始。有什么可以轉(zhuǎn)移的?
Andrej:
基本上,所有東西都可以轉(zhuǎn)移。而且我認(rèn)為人們并沒有意識(shí)到這一點(diǎn)。
NoPriors:
好的。這是一個(gè)很大的聲明。這看起來是一個(gè)完全不同的問題。
Andrej:
我認(rèn)為汽車在實(shí)際觀察時(shí)基本上就是機(jī)器人。汽車是機(jī)器人。
我認(rèn)為特斯拉不是一家汽車公司,這種看法是誤導(dǎo)性的。特斯拉是一家規(guī)模化的機(jī)器人公司。規(guī)模化也是一個(gè)完全獨(dú)立的變量。他們不是在制造單一的產(chǎn)品,而是在制造制造產(chǎn)品的機(jī)器,這是一個(gè)完全不同的事情。所以我認(rèn)為特斯拉是一家規(guī)模化的機(jī)器人公司。
從汽車到人形機(jī)器人之間的轉(zhuǎn)變實(shí)際上并不費(fèi)勁。早期版本的Optimus機(jī)器人,它以為自己是輛車,因?yàn)樗型耆嗤碾娔X和攝像頭。這真的很有趣,因?yàn)槲覀冊(cè)跈C(jī)器人上運(yùn)行汽車網(wǎng)絡(luò),而它在辦公室走來走去。它試圖識(shí)別可駕駛空間,但現(xiàn)在我想都是可行走的空間了。實(shí)際上,它有點(diǎn)泛化了,需要進(jìn)行一些微調(diào)。它認(rèn)為自己是在駕駛,但實(shí)際上是在穿越一個(gè)環(huán)境。
NoPriors:
一種合理的方式來看待這件事,實(shí)際上,它是一個(gè)機(jī)器人,很多東西可以轉(zhuǎn)移,但比如說你缺少執(zhí)行和行動(dòng)數(shù)據(jù)。
Andrej:
是的,你肯定會(huì)缺少一些組件。但我還想說的是,很多東西是可以轉(zhuǎn)移的,比如說Optimus的啟動(dòng)速度,對(duì)我來說非常令人印象深刻。因?yàn)镋lon一說我們要做這個(gè),大家就帶著所有合適的工具出現(xiàn)了。所有東西很快就出現(xiàn)了,所有這些CAD模型和供應(yīng)鏈的東西。我感覺,哇,Tesla內(nèi)部有這么多構(gòu)建機(jī)器人方面的專業(yè)知識(shí)。而且用的工具都是一樣的。就好像在重新配置,從一輛汽車變成《Transformer》電影里的那種。它們只是被重新配置和重新洗牌,但就像是同樣的東西。你需要所有相同的組件,你需要考慮所有相同種類的東西,無論是在硬件方面、規(guī)模方面,還是在智能方面。
關(guān)于智能,有很多的轉(zhuǎn)移,不僅是特定網(wǎng)絡(luò)的轉(zhuǎn)移,還有整個(gè)方法、標(biāo)簽團(tuán)隊(duì)以及所有協(xié)調(diào)和人們采用的方法。我只是覺得有很多的轉(zhuǎn)移。
NoPriors:
但你認(rèn)為人形機(jī)器人或人形設(shè)備的第一個(gè)應(yīng)用領(lǐng)域會(huì)是什么?
Andrej:
我認(rèn)為很多人有這樣的愿景,比如說做洗衣服等等。我認(rèn)為那會(huì)來得很晚。我不認(rèn)為B2C是一個(gè)正確的起點(diǎn),因?yàn)槲也徽J(rèn)為我們可以讓機(jī)器人像是撞傷奶奶,這就是我的看法,有點(diǎn)像是這樣的。我覺得這會(huì)涉及太多的法律責(zé)任。我認(rèn)為這不是正確的方法。但比如說一個(gè)非常詭異的擁抱。它只會(huì)倒下之類的事情,你知道的,這些東西還不完美,需要一些工作才能改進(jìn)。我認(rèn)為最好的客戶首先是你自己。特斯拉可能會(huì)采取這種方式。如果人們能看得出來,我對(duì)特斯拉非常看好。
第一個(gè)客戶是你自己,你在工廠里孵化它,可能進(jìn)行大量的物料處理等工作。這樣,你不必與第三方合作簽訂合同,避免了涉及律師等繁瑣的事情。你孵化它,然后第二步是B2B。你去那些有巨大倉庫的公司,我們可以進(jìn)行物料處理,起草合同,安裝圍欄,完成所有這些事情。
當(dāng)你在多家公司孵化后,我認(rèn)為那時(shí)候你才開始進(jìn)入B2C應(yīng)用。我確實(shí)認(rèn)為我們還會(huì)看到B2C機(jī)器人,比如Unitree等公司開始推出我非常想要的機(jī)器人。有一個(gè)G1機(jī)器人,我可能會(huì)買一個(gè),而且可能會(huì)有一個(gè)人在那些平臺(tái)上建立起來的生態(tài)系統(tǒng)。
在規(guī)模上的優(yōu)勢(shì)可能會(huì)使這種方法獲勝。但一開始,這涉及很多的物料處理,然后逐漸向越來越多的具體應(yīng)用發(fā)展。我真正感興趣的是Friedman關(guān)于樹葉吹機(jī)的挑戰(zhàn)。我會(huì)很喜歡看到一個(gè)樂觀主義者走在街上,小心翼翼地?fù)炱鹈恳黄瑯淙~,這樣我們就不需要樹葉吹機(jī)了。我認(rèn)為這是可行的,并且是一個(gè)驚人的任務(wù)。所以我希望這是其中一個(gè)最早的應(yīng)用。或者就算是耙葉也可以,那也應(yīng)該行得通,只是非常安靜地耙葉。
NoPriors:
他們確實(shí)有一個(gè)正在工作的機(jī)器,只是不是類人機(jī)器人。我們可以談一談?lì)惾藱C(jī)器人這個(gè)論點(diǎn)嗎?最簡單的解釋是這個(gè)世界是為人類而建的,你只需要建造一套硬件,正確的做法是建立一個(gè)可以在這套硬件上完成越來越多任務(wù)的模型。
還有另一種觀點(diǎn)認(rèn)為人類在任何特定任務(wù)上都不是最優(yōu)的。你可以讓他們更強(qiáng)大、更大、更小,或者其他任何方式,那為什么我們不做超級(jí)人類的事情呢?
Andrej:
對(duì)此,我認(rèn)為人們可能低估了進(jìn)入任何單一平臺(tái)的固定成本的復(fù)雜性。你為任何單一平臺(tái)支付了大量的固定成本,因此,集中化并擁有一個(gè)可以完成所有任務(wù)的平臺(tái)是非常有意義的。類人外形也非常吸引人,因?yàn)槿藗兛梢苑浅H菀椎剡M(jìn)行遠(yuǎn)程操作。因此,這是一種非常有用的數(shù)據(jù)收集方式,因?yàn)槿藗冿@然能夠很容易地進(jìn)行遠(yuǎn)程操作。我認(rèn)為這一點(diǎn)通常被忽視。當(dāng)然,還有你提到的為人類設(shè)計(jì)的世界等方面,所以我覺得這也很重要。
我認(rèn)為我們將在類人平臺(tái)上有一些變種,但任何平臺(tái)都有很大的固定成本。最后一個(gè)方面是,你可以從不同任務(wù)之間的遷移學(xué)習(xí)中受益良多。在人工智能中,你希望有一個(gè)單一的神經(jīng)網(wǎng)絡(luò),它是多任務(wù)的,能夠處理很多事情。這就是你獲得所有智能和能力的地方。這也是為什么語言模型如此有趣的原因,因?yàn)槟阌幸粋€(gè)單一的體系,比如文本領(lǐng)域,在執(zhí)行所有這些不同的問題時(shí),它們之間共享知識(shí),而且這一切都耦合在一個(gè)神經(jīng)網(wǎng)絡(luò)中。我認(rèn)為你需要那樣的平臺(tái)。你希望為撿葉子收集的所有數(shù)據(jù)能為所有其他任務(wù)帶來收益。如果你為某個(gè)單一用途構(gòu)建一個(gè)特殊的東西,你不會(huì)從所有其他任務(wù)的轉(zhuǎn)換中受益。
NoPriors:
是的,我認(rèn)為有一種說法是,G1大約是30Grand,但似乎很難在某個(gè)特定的物料清單(BOM)下構(gòu)建一個(gè)非常有能力的類人機(jī)器人。如果你想在輪子上裝一個(gè)能做事情的手臂,也許在開始時(shí)有更便宜的通用平臺(tái)方法。這對(duì)你有意義嗎?
Andrej:
更便宜的通用平臺(tái)方法?從硬件的角度來看,是的,我認(rèn)為這有意義。你可以給它裝一個(gè)輪子而不是腳,等等。
我確實(shí)感覺……我想知道這是否會(huì)有點(diǎn)陷入局部最小值。我只是覺得,選擇一個(gè)平臺(tái)并使其完美,是長期來看相當(dāng)不錯(cuò)的賭注。另外一件事是,我覺得這會(huì)讓人們感到熟悉,我認(rèn)為人們會(huì)理解你可能想與它交流。我覺得這其中的心理層面因素可能會(huì)更傾向于人類平臺(tái),除非人們害怕它并且更喜歡一個(gè)更加抽象的平臺(tái)。不過我不知道這是否會(huì)只是一個(gè)類似八輪怪物在做事情,我不知道這會(huì)不會(huì)讓人覺得更吸引或者更少吸引。
NoPriors:
有趣的是,我認(rèn)為Unitree的另一種形式是狗,而且這幾乎是一個(gè)更友好或更熟悉的形象。
Andrej:
是的,但隨后人們看《黑鏡》,突然這只狗變得像一個(gè)可怕的東西。所以,很難想透。我只是認(rèn)為從心理學(xué)上講,人們會(huì)很容易理解正在發(fā)生的事情。
NoPriors:
你認(rèn)為相對(duì)于證明這個(gè)未來,技術(shù)里缺少了什么里程碑?
Andrej:特指機(jī)器人嗎?
NoPriors:是的,特指機(jī)器人。或者是人形機(jī)器人或其他任何人類形態(tài)的東西?
Andrej:
我不確定我是否對(duì)這個(gè)問題有十分清晰的看法。我確實(shí)認(rèn)為在人形機(jī)器人這種形態(tài)中,對(duì)于下半身的控制,我不確定是否適合通過示范進(jìn)行模仿學(xué)習(xí)。因?yàn)橄掳肷砩婕昂芏嗟沽[控制等復(fù)雜問題。而對(duì)于上半身,則需要大量的遠(yuǎn)程操作、數(shù)據(jù)收集和端到端的處理。因此,在這個(gè)意義上,一切都變得非常混合化。
我不清楚這些系統(tǒng)是如何互動(dòng)的。
NoPriors:
當(dāng)我與這個(gè)領(lǐng)域的專家交談時(shí),他們很多關(guān)注的是執(zhí)行機(jī)構(gòu)、操作以及某種數(shù)字操作等。
Andrej:
我預(yù)計(jì)在一開始,大部分項(xiàng)目是通過遠(yuǎn)程操作來啟動(dòng),模仿它,直到能達(dá)到95%的成功率。然后談到人對(duì)機(jī)器人的比例,逐漸讓人們成為機(jī)器人的監(jiān)督者,而不是直接執(zhí)行任務(wù)。這些變化都會(huì)隨著時(shí)間的推移逐步發(fā)生。
我不知道是否有任何我特別熟悉的具體障礙。我只是覺得這需要很多繁重的工作。很多工具已經(jīng)可以使用。Transformers 是一個(gè)美麗的組織塊,你可以用它做任意的任務(wù)。你只需要數(shù)據(jù),把它以正確的形式輸入,訓(xùn)練它,進(jìn)行實(shí)驗(yàn),部署它,不斷迭代。這確實(shí)是很多繁重的工作。我不知道是否存在某個(gè)單獨(dú)的技術(shù)性問題會(huì)阻礙我們的進(jìn)步。
NoPriors:
我們現(xiàn)在的大塊研究處于什么狀態(tài)?
Andrej:
我們處于非常好的狀態(tài)。我認(rèn)為,也許還沒有完全被認(rèn)可,但 Transformer 確實(shí)非常了不起。它不僅僅是另一個(gè)神經(jīng)網(wǎng)絡(luò),而是一個(gè)非常通用的神經(jīng)網(wǎng)絡(luò)。例如,當(dāng)人們談?wù)撋窠?jīng)網(wǎng)絡(luò)中的縮放損失時(shí),縮放損失在很大程度上實(shí)際上是Transformer的特性。在Transformer之前,人們?cè)谕鍸STM和堆疊它們等。你實(shí)際上得不到清晰的縮放損失,這個(gè)東西實(shí)際上無法訓(xùn)練,也不起作用。是Transformer首次實(shí)現(xiàn)了真正的縮放,你得到了縮放損失,一切都變得合理了。
所以它就像是一個(gè)通用的訓(xùn)練計(jì)算機(jī)。我把它看作是一種計(jì)算機(jī),但它就像一個(gè)可微的計(jì)算機(jī)。你可以給它輸入和輸出,以及上億的數(shù)據(jù),然后你可以用反向傳播來訓(xùn)練它,它實(shí)際上會(huì)自我安排去完成任務(wù)。我認(rèn)為這實(shí)際上是我們?cè)谒惴I(lǐng)域偶然發(fā)現(xiàn)的一個(gè)神奇的東西。
其中有一些個(gè)別的創(chuàng)新。例如,殘差連接已經(jīng)存在了。你有需要插入的層標(biāo)準(zhǔn)化。你有注意力模塊。你沒有那些像tanh之類的飽和非線性,因?yàn)樗鼈儠?huì)消除梯度信號(hào),所以在Transformer中沒有這些。所以有幾項(xiàng)創(chuàng)新,大約四或五個(gè),都被整合到這個(gè)Transformer中。這就是谷歌在他們的論文中所做的。這種方法實(shí)際上已經(jīng)被訓(xùn)練出來了。突然間,你獲得了縮放損失,并且有了一個(gè)可以在很大程度上訓(xùn)練的結(jié)構(gòu)。這是一個(gè)重大的突破。
NoPriors:
你覺得我們還沒有達(dá)到這種突破的極限,因?yàn)楫?dāng)然會(huì)有關(guān)于數(shù)據(jù)壁壘以及規(guī)模進(jìn)一步發(fā)展的成本問題的討論。你怎么看這個(gè)問題?
Andrej:
我們開始進(jìn)入的領(lǐng)域是,我不認(rèn)為神經(jīng)網(wǎng)絡(luò)架構(gòu)再從根本上限制我們了。它已經(jīng)不是瓶頸了。以前Transformer是一種瓶頸,但現(xiàn)在它已經(jīng)不再是瓶頸了。現(xiàn)在我們更多地在討論什么是損失函數(shù),數(shù)據(jù)集在哪里。這些問題幾乎成為了瓶頸。
這不再是一個(gè)基于你想要它變成什么而重新配置的通用組織。這就是為什么許多活動(dòng)已經(jīng)轉(zhuǎn)移到了這個(gè)領(lǐng)域。很多公司和其他應(yīng)用這種技術(shù)的企業(yè)不再怎么考慮Transformer了。他們不再怎么考慮架構(gòu)。
Llama的發(fā)布中,Transformer并沒有太大的變化。我們?cè)黾恿薘oPE相對(duì)位置編碼,這是主要的變化。其他一切都無關(guān)緊要,像是一些小東西的3%的提升而已。但實(shí)際上,RoPE是唯一插入的東西。這就是Transformer在過去五年左右的變化。所以在這方面沒有太多的創(chuàng)新。大家都認(rèn)為這是理所當(dāng)然的,讓我們訓(xùn)練它,等等。然后大家主要在數(shù)據(jù)集和損失函數(shù)的細(xì)節(jié)上進(jìn)行創(chuàng)新。所以所有的活動(dòng)都集中在那里了。
NoPriors:
在那個(gè)領(lǐng)域,以前我們用的是互聯(lián)網(wǎng)數(shù)據(jù),現(xiàn)在互聯(lián)網(wǎng)數(shù)據(jù)已經(jīng)用完了。所以問題主要圍繞合成數(shù)據(jù)或者更昂貴的數(shù)據(jù)收集。
Andrej:
我覺得這是個(gè)好觀點(diǎn)。現(xiàn)在很多活動(dòng)都在大型語言模型(LLM)方面。互聯(lián)網(wǎng)數(shù)據(jù)不是你想要的用于訓(xùn)練你的Transformer的數(shù)據(jù)。它像是一個(gè)最近鄰,實(shí)際上讓你走得更遠(yuǎn),令人驚訝。但互聯(lián)網(wǎng)數(shù)據(jù)是一堆互聯(lián)網(wǎng)網(wǎng)頁,你真正想要的是你大腦里的內(nèi)心獨(dú)白,你大腦中的軌跡。在你解決問題時(shí),大腦中的路徑,如果我們有十億個(gè)這樣的路徑,比如AGI就在這里,大致來說,這在很大程度上是準(zhǔn)確的。而我們根本沒有這種情況。
所以現(xiàn)在很多活動(dòng)所在的領(lǐng)域,我認(rèn)為,是通過互聯(lián)網(wǎng)數(shù)據(jù)來實(shí)現(xiàn)接近這一點(diǎn),因?yàn)榛ヂ?lián)網(wǎng)碰巧有足夠的推理痕跡和大量的知識(shí),加上變換器使其工作的還不錯(cuò)。我認(rèn)為現(xiàn)在很多活動(dòng)集中在將數(shù)據(jù)集重構(gòu)為內(nèi)心獨(dú)白格式。大量合成數(shù)據(jù)的生成對(duì)此很有幫助。有趣的是,當(dāng)前的模型在多大程度上幫助我們創(chuàng)建下一代模型,就像是一種改進(jìn)的階梯。
NoPriors:
你認(rèn)為合成數(shù)據(jù)有多大用處,或者說能帶我們走多遠(yuǎn)?因?yàn)檎缒闼f,每個(gè)數(shù)據(jù)、每個(gè)模型都有助于更好地訓(xùn)練后續(xù)模型,至少在創(chuàng)建工具、數(shù)據(jù)標(biāo)注等方面,也許部分是合成數(shù)據(jù)。你認(rèn)為合成數(shù)據(jù)的部分有多重要?
Andrej:
當(dāng)我和人們談話時(shí),他們說,是的,我認(rèn)為這是我們能夠取得進(jìn)展的唯一途徑,我們必須讓它發(fā)揮作用。但在使用合成數(shù)據(jù)時(shí),你必須小心,因?yàn)檫@些模型會(huì)悄無聲息地退化。這是一個(gè)主要問題之一。
如果你去ChatGPT并讓它告訴你一個(gè)笑話,你會(huì)發(fā)現(xiàn)它只知道大約三個(gè)笑話。這就像是唯一的情況,它大多數(shù)時(shí)候只給你一個(gè)笑話,有時(shí)候會(huì)給你大約三個(gè)笑話。這是因?yàn)槟P屯嘶耍彝嘶们臒o聲息。
當(dāng)你看任何單一的輸出時(shí),你只看到了一個(gè)單一的例子。但當(dāng)你實(shí)際查看分布時(shí),你會(huì)注意到這不是一個(gè)非常多樣化的分布,悄無聲息地退化了。當(dāng)你進(jìn)行合成數(shù)據(jù)生成時(shí),這是一個(gè)問題,因?yàn)槟銓?shí)際上非常需要那種熵。你需要數(shù)據(jù)集中有豐富的多樣性和豐富性,否則,你得到的數(shù)據(jù)集會(huì)變得收縮。當(dāng)你查看任何單個(gè)示例時(shí),你看不到它,但分布已經(jīng)失去了大量的熵和豐富性,所以它在無聲中變得更糟。
這就是為什么你必須非常小心,必須確保在數(shù)據(jù)集中保持熵。為此有很多技術(shù)。例如,有人發(fā)布了Persona數(shù)據(jù)集作為示例。Persona數(shù)據(jù)集是一個(gè)包含十億個(gè)個(gè)性特征的數(shù)據(jù)集,像人的背景:“我是老師”或者“我是藝術(shù)家”,“我住在這里,我做這件事”等等。它就像是虛構(gòu)的人類背景的小段落。
當(dāng)你進(jìn)行合成數(shù)據(jù)生成時(shí),不只是說,完成這個(gè)任務(wù)并用這種方式做,而是想象你在向這個(gè)人描述,并加入這些信息,現(xiàn)在你迫使它探索更多空間,并獲得一些熵。所以你必須非常小心地注入熵,保持分布。我認(rèn)為這是困難的部分,也許人們一般不會(huì)充分意識(shí)到這一點(diǎn)。
所以我基本上認(rèn)為合成數(shù)據(jù)絕對(duì)是未來,我的印象是我們不會(huì)缺乏數(shù)據(jù)。我只是覺得你必須小心。
NoPriors:
你覺得我們現(xiàn)在從這項(xiàng)研究中學(xué)到了什么關(guān)于人類認(rèn)知的東西?
我不知道我們是否在學(xué)習(xí)……有人可以爭(zhēng)辯說,弄清我們想要的推理軌跡的形狀,例如,有助于實(shí)際理解大腦的運(yùn)作方式。
Andrej:
我會(huì)小心對(duì)待類比,但總的來說,我確實(shí)認(rèn)為這是完全不同的事物。不過,有些類比還是可以做的。
舉個(gè)例子,我認(rèn)為Transformer在很多方面實(shí)際上比人腦更好。它們實(shí)際上是一個(gè)更高效的系統(tǒng)。它們不如人腦工作的原因主要是數(shù)據(jù)問題,大體上說,這是我認(rèn)為的一階近似。
事實(shí)上,Transformer記憶序列的能力遠(yuǎn)遠(yuǎn)超過人類。比如,如果你給它一個(gè)序列,并在該序列中進(jìn)行一次前向和反向傳播傳遞,那么如果你給它序列的前幾個(gè)元素,它會(huì)完成序列的其余部分。它記住了那個(gè)序列,而且它對(duì)這個(gè)非常擅長。如果你給人類一次演示一個(gè)序列,人類是絕對(duì)記不住的。
因此,我確實(shí)認(rèn)為,基于梯度的優(yōu)化,我們?cè)谟?xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)一直進(jìn)行的前向-反向更新,在某些方面實(shí)際上比人腦更高效。這些模型更好,但它們還沒有準(zhǔn)備好大放異彩。在許多認(rèn)知方面,我認(rèn)為它們可能會(huì)突出。只要有了正確的輸入,它們會(huì)變得更好。
NoPriors:
這是計(jì)算機(jī)在各種應(yīng)用中都具有的算術(shù)能力,不是嗎?
Andrej:
我認(rèn)為人類的大腦有很多限制。工作記憶非常小,而Transformers有更大得多的工作記憶,這將繼續(xù)保持下去。它們是更高效的學(xué)習(xí)者。人腦在各種限制下運(yùn)作,不明顯的是人腦是否使用反向傳播,也不明顯那將如何工作。它是一個(gè)非常隨機(jī)的動(dòng)態(tài)系統(tǒng),在各種限制條件下工作,包括環(huán)境條件等等。
所以,我確實(shí)認(rèn)為我們實(shí)際擁有的東西潛力上比大腦更好,只不過還沒達(dá)到那一步。
NoPriors:
您如何看待隨著時(shí)間的推移,人類與不同的AI系統(tǒng)的增強(qiáng)?您認(rèn)為這是一個(gè)可能的發(fā)展方向嗎?用AI模型增強(qiáng)人類?
Andrej:
我認(rèn)為總體來說,絕對(duì)是這樣。
NoPriors:
因?yàn)椋幸环N抽象的版本,你將其用作工具,那是外部版本。還有,合并的場(chǎng)景,很多人最終談到這個(gè)。
Andrej:
我們已經(jīng)在某種程度上融合了。問題是,有輸入輸出的瓶頸。但大多數(shù)情況下,如果你有這些模型中的任何一個(gè),你已經(jīng)在使用它們了。
NoPriors:
是的,但那有點(diǎn)不一樣,因?yàn)槲蚁肴藗円呀?jīng)爭(zhēng)論了40到50年,認(rèn)為科技工具只是人類能力的延伸。計(jì)算機(jī)是人類思維的自行車,等等。
Andrej:對(duì),正是這樣。
NoPriors:
但是,有一部分AI社區(qū)認(rèn)為,我們可以通過某種形式解決與未來AI或其他事物的潛在沖突。例如,像Neuralink的提議,等等。
Andrej:
沒錯(cuò),就是這樣。我還不知道這種合并會(huì)是什么樣子,但我肯定能看出你想要減少工具使用的輸入輸出。我認(rèn)為這有點(diǎn)像一個(gè)外皮層。我們是在我們的新皮層上構(gòu)建,不是嗎?這只是下一層。它恰好在云中,等等。但它是大腦的下一層。
NoPriors:
早在2000年代初的《Accelerando》一書中就有一個(gè)版本,基本上所有東西都體現(xiàn)在一副計(jì)算眼鏡中,這副眼鏡與您的大腦連接,并且您佩戴它們。如果你失去了它們,你就會(huì)覺得失去了一部分個(gè)性或記憶。
Andrej:
我認(rèn)為這很有可能。今天,手機(jī)幾乎已經(jīng)是這樣了。我認(rèn)為情況會(huì)變得更糟。當(dāng)你把你的科技產(chǎn)品放在一邊時(shí),你就像大自然中的裸體人類,或者你失去了部分智慧。這非常令人焦慮。
NoPriors:
一個(gè)非常簡單的例子就是地圖。我注意到現(xiàn)在很多人其實(shí)不再能很好地導(dǎo)航他們的城市,因?yàn)樗麄兛偸鞘褂棉D(zhuǎn)彎提示方向。
Andrej:
如果我們有這樣一個(gè)東西,比如說通用翻譯器,我認(rèn)為離這不遠(yuǎn)了。如果你把你的東西放在一邊,你就會(huì)失去與不講英語的人交流的能力。
NoPriors:
我很樂意重新利用我大腦的那部分來做進(jìn)一步的研究。
Andrej:
我不知道你是否看過那個(gè)視頻,就像有個(gè)孩子,他拿著一本雜志,卻在雜志上滑動(dòng)。令我著迷的是,這個(gè)孩子不理解什么是自然存在的,什么是技術(shù)附加在自然之上的,因?yàn)樗兊萌绱送该鳌N艺J(rèn)為這看起來可能類似,人們將開始假設(shè)這些工具的存在。然后,當(dāng)你把它們拿走時(shí),你會(huì)意識(shí)到,人們好像不知道什么是技術(shù),什么不是。
如果你戴著這個(gè)東西,它總是在為你翻譯所有人或者為你做類似的事情,那么可能人們就會(huì)失去基本的認(rèn)知能力。我認(rèn)為存在這種可能性。
我們將會(huì)專精化。你不能理解說西班牙語的人嗎?這是什么情況?或者,當(dāng)你去到物體面前,就像在迪士尼,所有的物體都是有生命的。我認(rèn)為我們可能會(huì)走向那樣一個(gè)世界,為什么不能和物體說話呢?就像今天,你可以和Alexa說話,向她詢問一些事情等等。
NoPriors:
我見過一些玩具公司,它們?cè)噲D在玩具中嵌入一個(gè)大語言模型(LLM),以便能夠與孩子互動(dòng)。
Andrej:
是不是很奇怪,當(dāng)你走到一扇門前,不能直接說“開門”?另一個(gè)我喜歡的例子是《超能敢死隊(duì)》或《機(jī)械公敵》,有人取笑說你不能隨便和東西對(duì)話,真是見鬼了。
NoPriors:
如果我們?cè)谡務(wù)撏獠看竽X,這是一件非常重要的事情,需要將其民主化。你怎么看當(dāng)前的市場(chǎng)結(jié)構(gòu)以及在大規(guī)模語言模型研究中發(fā)生的事情?實(shí)際上,只有少數(shù)幾家大型實(shí)驗(yàn)室有機(jī)會(huì)在下一代訓(xùn)練中取得進(jìn)展。這對(duì)于未來人們能夠訪問的技術(shù)來說意味著什么?
Andrej:
你可能在暗示的是生態(tài)系統(tǒng)的狀態(tài)。我們有幾個(gè)封閉平臺(tái)形成的寡頭壟斷,同時(shí)也有相對(duì)落后的開源平臺(tái),比如Meta Llama等。這反映了開源生態(tài)系統(tǒng)的狀況。
當(dāng)我們開始把這些東西看作是一個(gè)外部大腦時(shí),有一句加密貨幣的說法叫“沒有你的密鑰,就沒有你的Token”。如果說,這就像“不是你的權(quán)重,就不是你的大腦”?
NoPriors:
這很有趣,因?yàn)橐粋€(gè)公司實(shí)際上在控制你的外皮質(zhì),因此很大一部分你的……
Andrej:
這開始感覺有點(diǎn)侵入性了。如果這是我的外皮質(zhì),我認(rèn)為人們會(huì)更加在意所有權(quán),是的。你意識(shí)到你是在租用你的大腦。似乎租用你的大腦有點(diǎn)奇怪。
NoPriors:
這個(gè)思想實(shí)驗(yàn)就像是,你愿意放棄所有權(quán)和控制權(quán)來租用一個(gè)更好的大腦嗎?因?yàn)槲以敢猓堑摹K晕艺J(rèn)為這是一個(gè)權(quán)衡,我們會(huì)看看這如何運(yùn)作。
Andrej:
也許有可能默認(rèn)使用封閉版本,因?yàn)樗鼈兒艹錾憧梢栽诟鞣N情況下有一個(gè)后備方案。我認(rèn)為這有點(diǎn)像今天事情的發(fā)展。就像當(dāng)一些封閉源提供商的API宕機(jī)時(shí),人們開始實(shí)現(xiàn)對(duì)開放生態(tài)系統(tǒng)的后備方案,他們完全控制并感到由此而來的賦權(quán)。所以,這也許就是對(duì)大腦未來樣子的擴(kuò)展,如果發(fā)生了什么事情,你就依靠開源資源。但是大多數(shù)時(shí)候,你其實(shí)……
NoPriors:所以開源資源持續(xù)進(jìn)步非常重要。
Andrej:
我認(rèn)為是這樣,百分之百。這不是一個(gè)顯而易見的觀點(diǎn),或者現(xiàn)在人們可能不一定同意的事情,但我百分之百認(rèn)為是這樣。
NoPriors:
我一直在想的是,最小的、高效的模型是什么,你可以在某種意義上達(dá)到,無論是參數(shù)大小還是你想怎么考慮?還有就是你的觀點(diǎn),因?yàn)槟銓?duì)蒸餾、小模型有很多思考,我有些好奇。
Andrej:
我認(rèn)為它可以出奇地小。而且我確實(shí)認(rèn)為當(dāng)前的模型浪費(fèi)了大量容量來記住不重要的東西。比如,它們記住了 SHA 哈希碼,記住了一些古老的東西……因?yàn)閿?shù)據(jù)集沒有得到最好的整理。
我認(rèn)為這種情況會(huì)有所改變。我們只需要到達(dá)認(rèn)知核心。我認(rèn)為認(rèn)知核心可以非常小,它只是一個(gè)會(huì)思考的東西。如果它需要查找信息,它知道如何使用不同的工具。
NoPriors:那是像30億參數(shù)嗎?是20億嗎?
Andrej:
我認(rèn)為甚至10億。10億就足夠了。我們可能會(huì)達(dá)到那一點(diǎn)。模型可以非常非常小。我認(rèn)為它們可以非常小的原因根本上,就像蒸餾一樣。蒸餾出乎意料地有效。蒸餾是你得到一個(gè)非常大的模型或者大量的計(jì)算資源之類的東西,監(jiān)督一個(gè)非常小的模型。你實(shí)際上可以把很多功能塞進(jìn)一個(gè)非常小的模型里。
NoPriors:
這是某種數(shù)學(xué)表示或信息理論公式嗎?因?yàn)閹缀醺杏X你現(xiàn)在應(yīng)該能夠計(jì)算這個(gè)。
Andrej:
可能吧。也許可以這樣考慮這個(gè)問題:我們回到互聯(lián)網(wǎng)數(shù)據(jù)集,這是我們正在處理的東西。互聯(lián)網(wǎng)大約是0.001%的認(rèn)知,99.99%的信息垃圾。我認(rèn)為大部分信息對(duì)思考部分沒有用。
NoPriors:
也許換個(gè)方式來問這個(gè)問題就是,有沒有一種數(shù)學(xué)表示形式可以體現(xiàn)認(rèn)知能力相對(duì)于模型大小的關(guān)系?或者你如何在你想要達(dá)成的目標(biāo)中捕捉認(rèn)知,知道這是最小值或最大值?也許沒有一個(gè)好的方式來表示這一點(diǎn)。
所以我認(rèn)為也許十億參數(shù)可以獲得一個(gè)不錯(cuò)的認(rèn)知核心。
Andrej:
我認(rèn)為即使是十億參數(shù)也太多了。我不知道。我們拭目以待。
NoPriors:
考慮到設(shè)備邊緣與云端的區(qū)別,以及使用模型的原始成本,一切都很令人興奮。但是在不到十億個(gè)參數(shù)的情況下,我也在本地設(shè)備上有我的外腦。
Andrej:
可能不是一個(gè)單一的模型,對(duì)我來說,思考這實(shí)際上會(huì)如何發(fā)展是很有趣的,因?yàn)槲艺J(rèn)為你想要從并行處理中受益。你不想有一個(gè)順序過程,你想要有一個(gè)并行過程。我認(rèn)為公司在某種程度上也有點(diǎn)像工作的并行化。但公司中有一個(gè)層級(jí)結(jié)構(gòu),因?yàn)檫@是組織內(nèi)進(jìn)行信息處理和簡化所需要的一種方法。所以我認(rèn)為我們最終可能會(huì)擁有一個(gè)大語言模型公司的結(jié)構(gòu)。我認(rèn)為你擁有各種不同能力、專注于獨(dú)特領(lǐng)域的模型并不是什么不太可能的事情。這將實(shí)際上在很大程度上開始類似于公司。程序員和項(xiàng)目經(jīng)理等角色在并行工作,并為你協(xié)同運(yùn)算。因此,也許這樣思考是不正確的。它更像是一個(gè)蜂群。你的外皮層就像是一個(gè)大型語言模型的蜂群。這更像是一個(gè)生態(tài)系統(tǒng),就像一個(gè)生物生態(tài)系統(tǒng),你在其中有專門的角色和生態(tài)位。我認(rèn)為它將開始趨同那樣。你有自動(dòng)地將問題上升到蜂群的其它部分,具體取決于問題的難度。所以也許CEO就像一個(gè)非常聰明的云模型,但工人可以便宜得多,甚至可能是開源模型或其他什么的。而我的成本函數(shù)與你的成本函數(shù)不同。所以這可能會(huì)很有趣。
NoPriors:
你離開了OpenAI,從事教育工作。你一直是一名教育者。那么,為什么要這樣做?
Andrej:
我的起點(diǎn)是,我一直是一名教育者,我熱愛學(xué)習(xí),也熱愛教學(xué)。這是一個(gè)我長期以來一直非常熱衷的領(lǐng)域。另一件事是,我認(rèn)為有一個(gè)宏觀的圖景在推動(dòng)我,我認(rèn)為在AI領(lǐng)域有很多活動(dòng)。而且我認(rèn)為大多數(shù)是想要取代或替代人類。這主題就像是把人滑到一旁。但我總是對(duì)能賦能人的任何事物更感興趣。從一個(gè)更高的層面看,我是站在人類一邊。我對(duì)AI能做什么來賦能人類感興趣。我不希望未來人們只是處于自動(dòng)化的一邊。我希望人們處于一種非常有權(quán)能的狀態(tài)。我希望他們變得非常出色,比今天出色得多。
另一個(gè)非常有趣的方面是,如果一個(gè)人有全科的完美導(dǎo)師,他們能走多遠(yuǎn)?我認(rèn)為如果人們有完美的課程安排,他們可以走得非常遠(yuǎn)。我們看到了這一點(diǎn),假如有些富人可能有導(dǎo)師,他們確實(shí)走得很遠(yuǎn)。所以我認(rèn)為我們可以通過AI甚至LexarPassive接近這一點(diǎn)。
NoPriors:
實(shí)際上,從80年代開始就有非常明確的文獻(xiàn)支持這一點(diǎn),一對(duì)一的輔導(dǎo)可以幫助人們提高一個(gè)標(biāo)準(zhǔn)差。是布魯姆的東西。有很多非常有趣的先例。
你如何通過AI的視角來看待這一點(diǎn)?或者說,什么樣的第一類產(chǎn)品能真正幫助實(shí)現(xiàn)這一點(diǎn)?因?yàn)橛邢瘛躲@石時(shí)代》這樣的書,他們討論了《年輕女士的插圖入門》之類的東西。
Andrej:
所以我會(huì)說,我肯定受到它某些方面的啟發(fā)。在實(shí)際操作中,我正在嘗試建立一個(gè)單一的課程,希望它能成為人們學(xué)習(xí)AI時(shí)的首選課程。我認(rèn)為基本問題在于如何擴(kuò)大這些課程的規(guī)模。例如,我曾在斯坦福教授過231N,這是第一門深度學(xué)習(xí)課程,并且相當(dāng)成功。但問題是,如何真正擴(kuò)大這些課程的規(guī)模?如何讓地球上的80億人都能受益?他們講不同的語言,能力水平各不相同,單個(gè)教師無法覆蓋如此廣泛的受眾。
因此,問題在于如何使用AI來擴(kuò)大一個(gè)優(yōu)秀教師的影響力。我這樣思考這個(gè)問題:老師負(fù)責(zé)大量的課程創(chuàng)建和設(shè)計(jì),因?yàn)橐阅壳暗腁I能力,我不認(rèn)為這些模型能夠創(chuàng)建一個(gè)好的課程。但我認(rèn)為它們適合成為學(xué)生的前端,向他們解釋課程內(nèi)容。基本上,老師不再直接面對(duì)學(xué)生,而是在后臺(tái)設(shè)計(jì)課程材料,AI則作為前端,能夠說各種不同的語言,引導(dǎo)學(xué)生完成整個(gè)課程。
NoPriors:這種情況可以理解為類似助教(TA)的體驗(yàn)嗎?
Andrej:
AI助教作為學(xué)生的前端,與學(xué)生互動(dòng)并引導(dǎo)他們完成課程。我認(rèn)為這是可以解決的,盡管現(xiàn)在還不存在,但它可以變得非常好。隨著時(shí)間的推移和能力的提高,課程設(shè)置可能會(huì)以各種方式重構(gòu)。
我喜歡找到一些東西,今天的人工智能能力和對(duì)它有一個(gè)良好的模型。我認(rèn)為很多公司可能并不直觀地理解今天的能力在哪里,最終會(huì)構(gòu)建一些超前于現(xiàn)有能力的東西,或者可能不夠雄心勃勃。因此,我確實(shí)認(rèn)為這是一個(gè)可能性與真正有趣和激動(dòng)人心的結(jié)合點(diǎn)。
NoPriors:
回到你剛才提到的某件事,我覺得非常鼓舞人心,特別是考慮到你的背景以及你對(duì)我們目前研究狀況的理解。基本上,我們不知道從學(xué)習(xí)的角度來看人類表現(xiàn)的極限是什么。考慮到更好的工具,這里有一個(gè)很簡單的類比。我們一個(gè)月前剛剛舉辦了奧運(yùn)會(huì),一個(gè)跑者以及最好的英里時(shí)間或者任何體育運(yùn)動(dòng),今天的水平比以前好多了。拋開像10年前的興奮劑不談,僅僅因?yàn)槟汩_始訓(xùn)練得更早,擁有一個(gè)非常不同的計(jì)劃,我們有更好的科學(xué)理解,我們有技術(shù),我們有裝備。
你相信如果我們從工具和課程開始,人類可以取得更大進(jìn)步,這一點(diǎn)令人驚嘆。
Andrej:
是的,我認(rèn)為我們甚至還沒有觸及到可能實(shí)現(xiàn)的任何一部分。所以我認(rèn)為基本上有兩個(gè)維度。第一個(gè)是全球化的維度,我希望每個(gè)人都能接受到真正優(yōu)質(zhì)的教育,另一個(gè)是一個(gè)人可以走多遠(yuǎn)。我認(rèn)為這兩個(gè)問題都非常有趣且令人興奮。
NoPriors:
通常,當(dāng)人們談?wù)撘粚?duì)一學(xué)習(xí)時(shí),他們關(guān)注的是其自適應(yīng)性,即在挑戰(zhàn)與其水平相當(dāng)?shù)娜恕D阏J(rèn)為今天可以用人工智能實(shí)現(xiàn)這一點(diǎn)嗎?還是說這是未來的事情,今天更多的是擴(kuò)大影響力、多語言和全球化?
Andrej:
顯而易見的是,諸如不同語言之類的事情非常容易實(shí)現(xiàn)。我認(rèn)為當(dāng)前的模型在翻譯方面實(shí)際上非常好,基本上可以實(shí)時(shí)定位和翻譯材料。所以很多事情都是顯而易見且容易實(shí)現(xiàn)的。
根據(jù)一個(gè)人的背景進(jìn)行適應(yīng),我覺得這不像是容易摘到的果實(shí),但也不至于難到遙不可及。不過這確實(shí)是你需要的東西,因?yàn)椴⒉皇敲總€(gè)人都有相同的背景。而且,如果你過去熟悉其他學(xué)科,利用你知道的東西來做類比也是非常有幫助的。這在教育中非常強(qiáng)大,所以這是一個(gè)你想要利用的維度。但我認(rèn)為這開始變得不那么顯而易見,需要一些工作。
一個(gè)簡單的版本不會(huì)太難,你可以想象只是提示模型,比如“哦,我懂物理”或者“我懂這個(gè)”。你可能會(huì)得到一些東西。但我指的是一些真正有用的東西,不是那種你可以演示,有時(shí)能工作的東西。我指的是它真的起作用,并且以一種人的方式起作用。
NoPriors:
這就是為什么我問到適應(yīng)性的問題,因?yàn)槿藗儗W(xué)習(xí)的速度不同,或者有些事物他們覺得有挑戰(zhàn)性,而其他人則不然,反之亦然。在這種情況下,你怎么去調(diào)整呢?我猜你可以隨著時(shí)間推移,將某人在某方面的優(yōu)劣重新引入到模型中。
Andrej:
這就是人工智能的特點(diǎn)。我覺得很多這些功能就像提示一樣。所以你總是會(huì)看到演示,但你真的會(huì)得到一個(gè)產(chǎn)品嗎?你知道我的意思嗎?在這個(gè)意義上,我會(huì)說演示很近,但產(chǎn)品還很遠(yuǎn)。
NoPriors:
我們之前討論過的一件有趣的事情是,研究界發(fā)生的某種血統(tǒng)關(guān)系。你來自某些實(shí)驗(yàn)室,每個(gè)人都在談?wù)摫舜藖碜阅膫€(gè)實(shí)驗(yàn)室。我認(rèn)為有相當(dāng)高比例的諾貝爾獎(jiǎng)得主實(shí)際上曾經(jīng)在前諾貝爾獎(jiǎng)得主的實(shí)驗(yàn)室工作過。所以這大概是某種文化、知識(shí)或品牌的傳播,不知道是哪一種。在一個(gè)以AI教育為中心的世界里,你如何保持譜系,或者這并不重要?或者你如何看待這些關(guān)于網(wǎng)絡(luò)和知識(shí)傳播方面的問題?
Andrej:
我其實(shí)不想生活在一個(gè)非常看重譜系的世界里,所以我希望AI可以幫助你稍微打破這種結(jié)構(gòu)。這感覺有點(diǎn)像某種稀缺資源的把關(guān)機(jī)制,好像是說,有有限數(shù)量的人擁有這個(gè)譜系等等。我認(rèn)為這有點(diǎn)像是某種方面的表現(xiàn)。
我希望它能夠打破這種結(jié)構(gòu)。
NoPriors:
這確實(shí)是一個(gè)方面,比如實(shí)際學(xué)習(xí)的一部分譜系。
這也像是聚集效應(yīng)。為什么所有或者大部分的AI社區(qū)都在灣區(qū)?為什么大部分的金融科技社區(qū)都在紐約?
我認(rèn)為很多時(shí)候是因?yàn)槟惆岩恍┯泄餐d趣和信念的聰明人聚集在一起,他們從這個(gè)共同核心中延伸出來,然后以一種有趣的方式分享知識(shí)。
你必須在某種程度上讓這種行為轉(zhuǎn)移到線上,尤其是對(duì)年輕人而言。
Andrej:
其中一個(gè)方面有點(diǎn)像教育方面。比如今天如果你是某個(gè)社區(qū)的一員,你會(huì)獲得大量的教育和學(xué)徒機(jī)會(huì)等,這非常有幫助,會(huì)讓你在那個(gè)領(lǐng)域達(dá)到一種有權(quán)能的狀態(tài)。
另一個(gè)方面是文化方面的,也就是你受什么激勵(lì)以及你想要從事什么工作。文化重視什么、推崇什么、奉什么為神圣?
在學(xué)術(shù)界,舉例來說,就是H指數(shù)。每個(gè)人都關(guān)心H指數(shù),你發(fā)表的論文數(shù)量等等。我曾是那個(gè)社區(qū)的一員,我見證了這一點(diǎn)。
我感覺現(xiàn)在我到了不同的地方,各個(gè)社區(qū)都有不同的偶像。我認(rèn)為這對(duì)人們的動(dòng)機(jī)、他們的社會(huì)地位以及他們真正關(guān)心的事物產(chǎn)生了巨大的影響。
我還覺得我曾是不同社區(qū)的一部分,比如在斯洛伐克長大,那是一個(gè)非常不同的環(huán)境,在加拿大也是一個(gè)非常不同的環(huán)境。
在那里重要的是什么?冰球。
舉個(gè)例子,我會(huì)說在加拿大,我在多倫多大學(xué)和多倫多。我不認(rèn)為它是一個(gè)非常具有企業(yè)家精神的環(huán)境。根本不會(huì)想到你應(yīng)該創(chuàng)業(yè)。人們不這么做。你不會(huì)有朋友在做這個(gè)。你也不知道你應(yīng)該仰望它。人們不會(huì)讀所有這些創(chuàng)始人們的書籍然后討論他們。這根本不是你向往或在意的事情。
每個(gè)人都在談?wù)摰氖牵阍谀睦镎业搅藢?shí)習(xí)?你以后打算去哪兒工作?而且大家似乎都接受有一套固定的公司列表,你應(yīng)該從中選擇并與其中一家對(duì)齊。這就是你仰望或者追求的目標(biāo)。
所以這些文化方面的因素非常強(qiáng)大,可能實(shí)際上是主要的變量。因?yàn)槲規(guī)缀跤X得,如今教育方面的問題已經(jīng)相對(duì)容易了,比如說有大量的資源已經(jīng)可用,等等。
所以我認(rèn)為主要是你所身處的文化環(huán)境。
NoPriors:
在這一點(diǎn)上,我們幾周前聊的一個(gè)話題是,我記得你也在網(wǎng)上發(fā)過,學(xué)習(xí)和娛樂是有區(qū)別的。學(xué)習(xí)確實(shí)應(yīng)該是困難的。我認(rèn)為這涉及到地位的問題,地位是一個(gè)偉大的激勵(lì)因素,比如說誰是偶像。
你認(rèn)為,通過這樣的系統(tǒng),在動(dòng)機(jī)方面你能夠改變多少,如果這是一個(gè)阻礙因素?你是否專注于給予人們資源,使他們能夠在自己的能力范圍內(nèi)盡可能地在過程中走得更遠(yuǎn),比歷史上的任何時(shí)候都更進(jìn)一步,已經(jīng)是鼓舞人心?或者你實(shí)際上是想改變有多少人愿意學(xué)習(xí),或者至少激勵(lì)他們走上學(xué)習(xí)的道路?
Andrej:
"愿意"是一個(gè)有負(fù)擔(dān)的詞。我會(huì)說,我想讓學(xué)習(xí)變得容易得多。然后可能會(huì)有人不愿意學(xué)習(xí)。今天,比如人們?yōu)榱藢?shí)際原因愿意學(xué)習(xí),比如他們想找到工作等等,這是完全有道理的。所以在一個(gè)前AGI社會(huì)中,教育是有用的。我認(rèn)為人們會(huì)因此而有動(dòng)機(jī),因?yàn)樗麄冊(cè)诮?jīng)濟(jì)上不斷攀升等等。
NoPriors:
但在后AGI社會(huì),我認(rèn)為教育在很大程度上將是一種娛樂。包括像成功的結(jié)果教育,不僅僅是讓內(nèi)容從你身上流過。
Andrej:
是的,我認(rèn)為是這樣的。結(jié)果就像理解、學(xué)習(xí)、能夠貢獻(xiàn)新知識(shí),或者你如何定義它。
NoPriors:
我認(rèn)為這不是偶然的,如果你回到200年前、300年前,那些做科學(xué)的人是貴族或有錢人。我們都會(huì)成為與安德烈一起學(xué)習(xí)的貴族。
Andrej:
是的。我確實(shí)認(rèn)為我看到它非常類似于你之前的引用。我覺得學(xué)習(xí)某些東西有點(diǎn)像去健身房,但這是對(duì)大腦的鍛煉,就像去健身房的感覺。去健身房是很有趣的。人們喜歡舉重等。有些人不去健身房。不,不。有些人去,但需要努力。是的。是的,需要努力,但它是努力的,同時(shí)也有點(diǎn)有趣。你也有一個(gè)回報(bào),比如你在各方面對(duì)自己感覺良好,而且我認(rèn)為教育基本上等同于那樣的感覺。
所以這就是我說教育不應(yīng)該是有趣的時(shí)候的意思,等等。這有點(diǎn)有趣,但我認(rèn)為這是一種特定的樂趣,我確實(shí)認(rèn)為,也許在一個(gè)后AGI的世界里,我希望發(fā)生的是人們實(shí)際上,他們確實(shí)經(jīng)常去健身房,不僅是身體上的,還包括精神上的。這是我們仰望的東西,有很高的教育程度。
Priors:
我可以問你關(guān)于Eureka的最后一個(gè)問題嗎,只是因?yàn)槲矣X得這會(huì)讓人們感興趣。比如第一個(gè)課程的受眾是誰?
Andrej:
第一個(gè)課程的受眾,我主要認(rèn)為這是一個(gè)本科水平的課程。所以如果你在技術(shù)領(lǐng)域讀本科,我認(rèn)為這將是一個(gè)理想的受眾。我確實(shí)認(rèn)為我們現(xiàn)在看到的是一種陳舊的教育概念:你上學(xué),然后畢業(yè)去工作。顯然,這樣的模式在一個(gè)變化如此迅速的社會(huì)里會(huì)完全崩潰。隨著科技的快速發(fā)展,人們會(huì)更加頻繁地回到學(xué)校學(xué)習(xí)。
這種學(xué)習(xí)有點(diǎn)像本科的水平,但我認(rèn)為任何年齡段的人都在范圍之內(nèi)。年齡上會(huì)非常多樣化,但主要是那些技術(shù)性的人,他們大多數(shù)是真正想要了解不少內(nèi)容的人。
NoPriors:他們什么時(shí)候可以上這門課?
Andrej:
我希望是在今年年底。我確實(shí)有很多干擾正在積累,但我認(rèn)為明年初可能是個(gè)時(shí)間節(jié)點(diǎn)。我在努力把它做好,這確實(shí)需要時(shí)間才能完成。
NoPriors:
我還有最后一個(gè)相關(guān)的問題。如果你今天有小孩子,你認(rèn)為他們應(yīng)該學(xué)習(xí)什么以確保一個(gè)有用的未來?
Andrej:
在我看來,有一個(gè)正確的答案。正確答案大概是數(shù)學(xué)、物理、計(jì)算機(jī)科學(xué)這些學(xué)科。我這么說的原因是因?yàn)槲艺J(rèn)為它對(duì)思維能力有幫助,這是最佳的思維技能核心。
當(dāng)然,我有特定的背景,所以我會(huì)這么想,這只是我的看法。我覺得我上過的物理課和其他課都塑造了我的思維方式,這對(duì)解決問題非常有用,總的來說等等。如果我們處在一個(gè)AGI前的世界,這會(huì)有用。在AGI之后,你仍然希望有能力的人類可以在任何任意能力中發(fā)揮作用。所以我認(rèn)為這是對(duì)人們的正確答案,他們應(yīng)該做和學(xué)的事情,要么有用,要么好。
我認(rèn)為很多其他的東西你可以稍后再添加,但在人們有大量時(shí)間和注意力的關(guān)鍵時(shí)期,應(yīng)該主要用來做這些簡單操作密集型的任務(wù)和工作負(fù)載,而不是記憶密集型的任務(wù)和工作負(fù)載。我學(xué)的是數(shù)學(xué)學(xué)位,覺得在學(xué)習(xí)的過程中,感覺自己的大腦正在開辟一條新溝槽,而且這種溝槽在以后會(huì)更難開辟。
當(dāng)然,我還會(huì)把很多其他東西也加入進(jìn)來,比如,我并不排斥所有其他學(xué)科。我認(rèn)為擁有多樣性的事物其實(shí)是很美的,但我確實(shí)認(rèn)為其中的80%應(yīng)該像這樣。
NoPriors:
首先,與我們的工具相比,我們不是有效的記憶者。
謝謝你做這件事,真是太有趣了。
Andrej:很高興來到這里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.