未經(jīng)許可不得轉(zhuǎn)載, 務必保留公眾號名片
Web3天空之城·整理制作
【城主說】本次訪談深入探討了李飛飛博士的最新動向與深刻見解。她詳細闡述了其新公司 World Labs 的核心使命——開發(fā)“空間智能”與3D生成式基礎模型,并解釋了為何這項技術對實現(xiàn)完整的人工智能至關重要。訪談回顧了 ImageNet 的誕生歷程,強調(diào)了數(shù)據(jù)、遠見和無畏精神在科學突破中的決定性作用。最后,李飛飛博士分享了她對機器人技術、跨學科團隊建設以及以人為本的AI未來發(fā)展的樂觀愿景,強調(diào)AI的最終目標是賦能于人,解決醫(yī)療等領域的重大挑戰(zhàn)。
核心觀點
? 空間智能是AI的基石 :人工智能若要完整,就必須具備理解、推理和生成3D世界的能力,因為這是我們所處物理世界的基本屬性。
? 構(gòu)建3D世界模型是下一個前沿 :繼語言模型之后,攻克3D生成式基礎模型是解鎖大量應用(從創(chuàng)意設計到機器人技術)的關鍵,也是當前AI領域最困難的問題之一。
? 無畏精神驅(qū)動創(chuàng)新 :無論是創(chuàng)建ImageNet還是創(chuàng)辦新公司,敢于挑戰(zhàn)不確定性、大膽假設的“無畏”精神是推動科學和技術突破的核心動力。
? AI的終極目標是賦能人類 :技術應以人為本,作為協(xié)作工具來增強人類的能力,以應對醫(yī)療、教育等領域的復雜挑戰(zhàn),促進社會福祉。
? 數(shù)據(jù)與模擬至關重要 :高質(zhì)量、多模態(tài)的數(shù)據(jù)(包括被低估的觸覺數(shù)據(jù))和高保真模擬環(huán)境,對于訓練更強大的機器人和通用智能體是不可或缺的。
Sarah
: 大家好,聽眾朋友們。今天我們的嘉賓是李飛飛博士,她是計算機視覺和深度學習領域的先驅(qū)。她創(chuàng)建了ImageNet,這個開創(chuàng)性的數(shù)據(jù)集幫助引發(fā)了深度學習革命。李飛飛是斯坦福大學教授,也是斯坦福以人為本人工智能研究院的聯(lián)合主任。她還曾領導谷歌云人工智能部門,為國際政策制定者提供咨詢,最近還聯(lián)合創(chuàng)辦了World Labs,一家致力于開發(fā)空間智能人工智能的公司。飛飛,感謝你今天加入我們。
李飛飛
: 謝謝邀請。
Sarah
: 這會很有趣。在過去的20年里,您對科學和政策做出了非凡的貢獻。我先從最大的問題開始。比如,為什么現(xiàn)在創(chuàng)業(yè)?
李飛飛
: 因為在我內(nèi)心深處,我渴望創(chuàng)造。我認為這是一個至關重要、充滿樂趣和令人興奮的時刻,可以構(gòu)建一些每個人都能使用的非凡技術。我對空間智能以及能夠賦能如此多的人和如此多的用例的3D世界模型深信不疑。而且我認為這將會非常令人興奮。而且我可以與一個極其、極其杰出的年輕技術專家團隊一起做到這一點。
Sarah
: 我想回到你正在合作的人這個問題上來,因為我認識你的一些聯(lián)合創(chuàng)始人,而且不久前我還在拼命地試圖說服他們創(chuàng)辦一家公司。然后他們說,哦,不,我們現(xiàn)在和 Fei-Fei 有一個更大的使命。
定義空間智能
Sarah
: 什么是空間智能?你能為更廣泛的受眾定義一下嗎?
李飛飛
: 對我來說,空間智能是理解、推理、互動和生成3D世界的能力,因為無論你怎么說我們可以投影它,我們的世界從根本上來說都是3D的。而且它是3D的,因為物理上它就是3D的。而且在數(shù)字層面,如果存在真正的3D呈現(xiàn),那么我們可以更容易地實現(xiàn)很多事情,無論是設計、創(chuàng)造、導航,還是模擬,或是體驗AR、VR,對我來說,這些都是空間智能的一部分。
再次強調(diào),我認為真正讓我興奮的是人類擁有空間智能。這是我們核心智能能力的一部分。動物也擁有空間智能。整個進化過程也與空間智能的進化緊密相連。所以它是如此的根本。如果沒有空間智能,人工智能將是不完整的。
李飛飛
: 這如何轉(zhuǎn)化為你正在用你的公司做的事情?或者說,你能分享一些關于這相對于你正在構(gòu)建的東西意味著什么的信息嗎?
李飛飛
: 是的,我們正在破解人工智能領域最難的問題之一,即構(gòu)建從根本上是3D的世界模型。因為一旦你攻克了這個問題,你就可以解鎖大量的空間智能問題。據(jù)我們所知,我們是第一家解決這個問題的公司,即3D生成基礎模型問題。
世界模型的愿景與挑戰(zhàn)
Sarah
: 我有很多問題。但是,既然你首先將這一點描述為3D對于理解世界的至關重要性,這是否意味著你認為,World Labs或其他學術界或公司創(chuàng)建的世界模型,將來會像現(xiàn)實一樣準確,比如能夠呈現(xiàn)物理規(guī)律并理解世界,從而使我們能夠做更多的事情?
李飛飛
: 是的,它應該是現(xiàn)實般準確或合理的。所以你可以創(chuàng)造一個奇幻的世界,但它應該是合理的,因為它的幾何結(jié)構(gòu)和物理特性需要是合理的。而這對于空間智能來說是至關重要的。
Sarah
: 這是否意味著你有一個特別的觀點,從神經(jīng)科學的角度來看,比如視覺智能有多么重要?我的意思是,你一直是計算機視覺領域的領導者,對吧,但是視覺智能與大型語言模型和文本智能相比,有多么重要?
李飛飛
: 實際上,我的確有。我認為從神經(jīng)和認知科學的角度來看,空間智能是進化必須為動物解決的一個非常困難的問題。真正有趣的是,我認為動物在某種程度上解決了這個問題,但并沒有完全解決。這是最難的問題之一,因為動物必須解決的問題是什么?動物必須進化出在某種程度上收集光線的能力,我們通常稱之為眼睛。然后通過這些眼睛收集的光線,它們必須在某種程度上于腦海中重建一個3D世界,以便它們能夠?qū)Ш讲⒆鍪虑椤.斎唬鼈兛梢曰印τ谌祟悂碚f,我們在操作能力方面是最強的動物,我們可以做很多事情。所有這些都是空間智能。對我來說,這僅僅根植于我們的智能。
有趣的是,即使在動物中,這也不是一個完全解決的問題。我們,例如,就人類而言,對吧?如果我現(xiàn)在讓你閉上眼睛,畫出或構(gòu)建一個你周圍環(huán)境的3D模型,這并不容易。
Sarah
: 在經(jīng)過訓練之前,我們沒有那么強的能力來生成極其復雜的3D模型。
李飛飛
: 你知道,我們中的一些人,無論是建筑師、設計師,還是只是接受過大量訓練且天賦異稟的人。那是一件很難的事情。想象一下,你可以在指尖上更輕松地完成它,并且允許更流暢的交互性和可編輯性。對人們來說,那將是一個完全不同的世界,絕非雙關語。
AI缺失的下一個領域
李飛飛
: 是否還有其他像空間智能這樣的大領域,你覺得從模型的角度來看,它還沒有得到充分的發(fā)展,或者其他你認為普遍存在的缺失,隨著我們構(gòu)建這種人工智能的未來,我們應該隨著時間的推移關注,或者人們應該構(gòu)建出來?我只是想知道,除了3D和世界生成等其他大問題之外,因為感覺我們已經(jīng)隨著時間的推移解決了一些大問題,還有其他一些問題我們正在努力解決。
李飛飛
: 我們正在某種程度上解決語言問題。我認為語言問題在很大程度上已經(jīng)解決了。而3D,在我看來,和語言一樣至關重要且困難。那么還有什么問題沒有解決呢?我的意思是,整個情商領域是我甚至不知道該如何著手解決的問題。
李飛飛
: 我認識很多人都沒能解決這個問題。
李飛飛
: 所以,那才是實現(xiàn)通用人工智能(AGI)的時候。
Sarah
: 我可以告訴你,用于訓練的數(shù)據(jù)不會來自硅谷的人們。不要低估硅谷。我會把自己歸為這一類,但我認為我們可能需要更廣泛的人群參與。
李飛飛
: 是的,沒錯,我同意。
Sarah
: 但這些是三個大類。
李飛飛
: 說實話,我不知道,你們怎么看,伊蘭和莎拉?
李飛飛
: 我認為這很大程度上取決于你在每個模型中封裝的內(nèi)容。所以我同意你關于這三個方面的框架。然后像某些東西,你知道,空間智能,我假設它也深入到不同類型的物理模擬和世界模擬中。而且,你知道,就像那些是很大的領域,我認為很多人沒有在研究,但我認為它們真的很有趣或很重要。而且存在著它的宏觀和微觀尺度。微觀尺度最終會變成材料科學和其他非常不同的東西,與你所說的內(nèi)容不同,它更像是分子建模,或者...
李飛飛
: 對。并且這超出了當前人工智能的定義,但我認為它們會因此而得到增強。當然,有機器人技術,但機器人技術很大程度上是一個系統(tǒng)集成問題,就像,你知道,即使你觀察動物,也不僅僅是大腦中的計算本身。
李飛飛
: 是的,相對于動物擁有的特定系統(tǒng),很多這些事情在空間智能方面似乎更加分散。而且在某些情況下,正如你所說,并不像人們想象的那么集中。因此,開始根據(jù)有機體中更分散的智能模型,而不是中樞神經(jīng)系統(tǒng),進行思考是非常有趣的。但是,是的,我認為我認為這是非常有趣的事情。
機器人、模擬與數(shù)據(jù)金字塔
Sarah
: 飛飛,你也做過機器人技術和類物理智能領域的工作。我認為,對于機器人基礎模型和驅(qū)動的數(shù)據(jù)層級來說,你知道,人們當然想使用視頻,對吧?因為那是我們可以獲得的。關于模擬以及今天你能從中獲得多少,存在一個很大的問題。也許人們沒有看到未來可供我們使用的質(zhì)量和物理特性。然后還有,你知道的,接近具身性的,比如不同形式的遙操作,以及類似具身數(shù)據(jù)收集。這是你腦海中的層級結(jié)構(gòu)嗎?或者你認為人們低估了模擬和世界模型在未來的作用?
李飛飛
: 是的,好問題。首先,正如你所說,我的確從事機器人研究工作,尤其是在我在斯坦福的實驗室里。我毫不懷疑人類將進入一個與機器人共存的時代。而且,“機器人”一詞并不一定指人形機器人。機器人可以呈現(xiàn)各種各樣的形式和形狀。實際上,幾年前,我的實驗室寫了一篇非常有趣的論文,關于形態(tài)智能,即智能體的形態(tài)實際上可以通過優(yōu)化它們試圖完成的任務來改變。所以我們應該比僅僅想象人形機器人更有想象力。
說了這么多,關于如何訓練機器人,你提到了整個數(shù)據(jù),有些人稱之為數(shù)據(jù)金字塔或數(shù)據(jù)蛋糕之類的。我同意。我認為這將是許多不同形式數(shù)據(jù)的混合。我還認為模擬被低估了。實際上,很多專家和業(yè)內(nèi)人士并沒有低估它。如果你看看很多機器人公司,他們都在研究模擬和合成數(shù)據(jù)。我也認為我們必須意識到,與語言模型甚至與空間智能基礎模型不同,機器人是一個高度多模態(tài)的系統(tǒng)。我認為真正被低估的是觸覺,依我之見。如果我們想要進行操作,而不僅僅是導航,觸覺就顯得尤為重要。我認為將觸覺真正整合到視覺、感知和空間數(shù)據(jù)中的能力是絕對關鍵的。
機器人的形態(tài)與未來
李飛飛
: 你說過的一件事我覺得非常有趣,那就是機器人可能適應或采用哪些不同的形態(tài)形式。關于潛在的未來,人們提出了兩種相互對立的論點。一種論點是,從供應鏈的角度以及管理構(gòu)建和制造規(guī)模的角度來看,形態(tài)因子的數(shù)量將會大大減少。另一種論點是,專業(yè)化的經(jīng)濟價值非常高。因此,隨著我們走向機器人驅(qū)動的未來,將會出現(xiàn)成千上萬種不同的形態(tài)因子。對于我們可能在這兩種觀點之間最終落腳于何處,你有什么看法?
李飛飛
: 我認為我們正處于一個梯度下降的過程中,最終目的是優(yōu)化生產(chǎn)力和效率。我的假設是,不同任務的需求如此之多,以至于只有極少數(shù)的形態(tài)或堅持一種形態(tài)是能源效率低下的。并且許多任務可以并且應該由能源效率更高的形態(tài)因子來完成。只是一個極端而瑣碎的例子。如果我們把機器人放到水下,它們就不應該做成人形。它們最好是魚的形狀,對吧?想想能源效率就明白了。飛行也是一樣。我認為人形……我們的飛機正變得越來越像機器人。
3D生成模型的近期應用
Sarah
: 所以我確實認為會存在多樣性。機器人技術是未來一個潛在的應用領域。首先你是一位科學家,但同時,你也參與了Twitter董事會與初創(chuàng)公司相關的工作。你能想象到哪些近期可實現(xiàn)的、用于生成3D世界的商業(yè)應用?
李飛飛
: 我相信創(chuàng)造力是一個非常令人興奮的領域,在這個領域中,人類可以通過人工智能和空間智能獲得超能力。在這里,我將它類比于軟件工程。如果你看看當今大型語言模型在軟件工程領域的成功,包括像Cursor和Windsurf這樣的應用程序以及所有這些,你看到的是人工智能和人類之間的大量協(xié)作。而且這種協(xié)作體現(xiàn)在不同的技能水平等等方面。我認為創(chuàng)造力也會類似,無論是設計師、3D藝術家、視覺特效藝術家,甚至是營銷人才和游戲開發(fā)者,在設計和創(chuàng)造3D空間方面都有大量的需求。即使對于訓練有素的專業(yè)人士來說,這從根本上說也是一個非常困難的問題,如果我們能正確地進行協(xié)作,擁有一個協(xié)作者將會非常有趣。所以我將創(chuàng)造力看作是一個非常令人興奮的領域。
我也確實認為,我們在元宇宙或增強現(xiàn)實、虛擬現(xiàn)實方面所等待的很多東西是內(nèi)容創(chuàng)作。我理解硬件本身需要不斷發(fā)展,但我也認為在軟件方面,我們正在尋找內(nèi)容創(chuàng)作。這自然而然地適用于3D建模和3D或生成式空間模型。這是另一個值得關注的有趣領域。
Sarah
: 你對于世界模型是否是可擴展強化學習的一個有趣答案,以實現(xiàn)更具泛化能力的智能體,有什么強烈的觀點嗎?
李飛飛
: 實際上,我的確認為它是這樣的。就像我說的,如果沒有空間智能,人工智能是不完整的,因為人類是在3D世界中互動的。在數(shù)字世界中,我們需要各種各樣的互動。你知道,以設計為例。這是一個非常深刻的領域,你知道,當我們思考設計時,我們會在腦海中優(yōu)化很多東西,無論是美觀、效率還是最優(yōu)化等等。這非常自然地適用于強化學習的設置。
Sarah
: 我想,在嘗試沿著這條道路,即設計和訓練世界模型的過程中,最大的挑戰(zhàn)是什么?我猜想其中之一是,例如,你研究過圖像,研究過視頻,但是我們擁有圖像和視頻,而我們沒有很多,你知道,像你正在構(gòu)建的那樣,以某種格式呈現(xiàn)的3D世界。
李飛飛
: 是的,數(shù)據(jù)絕對是一個挑戰(zhàn)。你完全說對了。你知道,要創(chuàng)建世界模型、3D基礎模型,我們需要越來越復雜的數(shù)據(jù)工程、數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)合成。所以,我非常羨慕我的自然語言處理大語言模型同事們,他們在互聯(lián)網(wǎng)上擁有如此豐富的數(shù)據(jù),而我們不一定有這種優(yōu)越條件。所以,這絕對是一個挑戰(zhàn)。
另一個挑戰(zhàn)是3D,這有點諷刺,對吧?我們每個人每天都在使用3D,就像在很多場合一樣。基本上,你睜開眼睛,你所體驗的整個生活都是3D的。即使我們一直在電腦上打字或者盯著屏幕,但與語言相比,它仍然不是一種更容易交付到人們手中的形式因素。語言是如此簡單。而且它也是一種非常主動的形式……它不是被動地觀看。沒有人醒來說,我就要坐在這里看3D,你知道嗎?所以,這給產(chǎn)品化以及如何以正確的方式進行產(chǎn)品化帶來了挑戰(zhàn)。你曾經(jīng)玩過《第二人生》之類的游戲嗎?
Sarah
: 或是其他什么游戲?
李飛飛
: 我不是一個游戲玩家,但是我的孩子們喜歡《我的世界》。
Sarah
: 我本來想問你,是否存在你想要體驗或想象的世界。
李飛飛
: 莎拉,這是個好問題。你知道,我渴望看到各種各樣的世界。我喜歡看到我未曾見過的世界。例如,像不斷放大,進入微觀世界,或者,你知道的,進入引擎的內(nèi)部,了解引擎的實際運作方式。我知道,當然,我理論上知道它是如何運作的,但是親眼看到它,體驗它,甚至,你可能會覺得好笑,我想進入洗碗機內(nèi)部。只是體驗那是什么。如果我們能夠創(chuàng)建任何事物的世界模型,所有這些都可以以虛擬方式完成。
回顧:ImageNet的誕生
Sarah
: 好的,我想阿拉德和我都很想談談您過去的職業(yè)生涯,以及可能為正在進行研究或試圖在人工智能領域產(chǎn)生影響的人提供的一些見解。在此之前,我問安德烈·卡帕斯我應該問你什么。他說,你知道,李飛飛在抱負和思考數(shù)據(jù)方面真的很神奇。你應該問問她關于她的博士學位,比如,以及與皮埃特羅一起創(chuàng)建那個一對一數(shù)據(jù)集的事情,因為它具有指導意義。所以我必須問問你這件事。
李飛飛
: 你知道,首先,我必須說,當你的學生比你更有名,取得的成就比你更多時,這總是最棒的事情。這讓我感到非常自豪。為安德烈感到非常自豪。我很驚訝他記得我的博士研究。所以,是的,這是真的。那,嗯,天哪,要追溯到2003年左右,當時世界才剛開始觸及互聯(lián)網(wǎng)的皮毛,數(shù)據(jù)還算不上什么。但從事計算機視覺研究時,我們,我的博士研究真的試圖讓物體識別發(fā)揮作用。那個問題就是,當你看到一張圖片時,要識別出貓、狗、微波爐、椅子等等所有東西。我們當時開始假設數(shù)據(jù)很重要,但我們毫無概念。沒有比例定律。我們不知道,你知道的,數(shù)據(jù)能走多遠。我們想要的只是,如果我們有一個機器學習算法,無論是神經(jīng)網(wǎng)絡還是那時非常流行的貝葉斯網(wǎng)絡,或者是支持向量機,我們需要一些數(shù)據(jù)來訓練。并且沒有數(shù)據(jù)可供訓練。
作為一名博士生,你當然想畢業(yè)。然后,Pietro就說,這樣吧,F(xiàn)eifei,整理一個數(shù)據(jù)集。我,你知道,我當時在想,是的,我的確需要整理一個數(shù)據(jù)集,因為現(xiàn)有的每個數(shù)據(jù)集都太小了。我只是不太信服。然后Pietro和我一直在討論,你知道,到底是15個不同的東西還是30個不同的東西,然后更可怕的是,博士導師說了三位數(shù)100。我當時就想,你知道,這工作量太大了。但我內(nèi)心深處知道,從數(shù)學的角度來看他是對的,為了推動模型泛化,我們需要足夠的數(shù)據(jù),至少要足夠。所以,你知道,我確實在我的書《我所看到的世界》中寫到了這個過程,我偶然發(fā)現(xiàn)了一本詞典。而且那真的是為了我自己的英語學習,那本詞典,我想是韋氏詞典,如果我沒記錯的話,它只是隨機地包含了一些單詞的視覺描述。我甚至不知道他們遵循什么規(guī)則,說實話,有些是花,有些是自行車,有些是狗。我當時就想,好吧,這實際上,你可以稱之為作弊或者工具。我抓取了101個這樣的詞語。這真的讓我博士生導師有點忍俊不禁,因為他會說,啊,是啊,你就是想比我要求的多做一點,你知道,想挑戰(zhàn)我。所以我就那樣做了。而且我得說,我仍然記得,我下載或者說,你知道,嘗試從谷歌下載,那時候谷歌還很新。而且那時候的谷歌圖片搜索非常糟糕,你知道,和今天相比。我不得不做大量的清理工作。有段時間,我變得非常絕望。我直接讓我媽媽做圖片清理,因為我在電腦上寫了一個小界面。她不懂電腦,但至少她知道點擊,點擊。所以她幫我做了一些事情。
職業(yè)生涯的決定性時刻
李飛飛
: 我的意思是,你在人工智能領域擁有著最輝煌的職業(yè)生涯之一。而且正如你所說,你的許多學生也都同樣在整個領域、整個行業(yè)、甚至整個世界取得了非常偉大的成就。當你回顧迄今為止的職業(yè)生涯時,你會想到哪兩三個時刻?當然,你的職業(yè)生涯還有很長的路要走。但我只是有點好奇。我的意思是,顯然,你在圖像和視覺識別相關系統(tǒng)以及各種方面都做了很多事情。但我只是有點好奇,比如,當你想到過去20年時,考慮到你所做的一切,什么是最突出的?
李飛飛
: 哦,謝謝你問這個問題。當然,ImageNet是其中之一……ImageNet由多個時刻組成,從早期的掙扎和被告知我不會獲得終身教職,到真正意識到亞馬遜的Mechanical Turk來救援,再到AlexNet獲勝的那一刻。并且在幾年前,我和杰夫·辛頓在多倫多參加了一個活動。他當時公開表示,這件事是多么具有決定性意義。他甚至有點抱歉,認為 ImageNet 沒有像神經(jīng)網(wǎng)絡那樣被廣泛認可。因此,這段歷程非常有意義。對于科學家來說,這種意義不在于認可或獎勵。而在于你做出了改變。就像那個沒人相信的猜想,那個沒人相信的假設,我們最終實現(xiàn)了它。這是其中一個線索。
Sarah
: 為了確保那些不熟悉的商界人士了解,ImageNet 是一個大規(guī)模的數(shù)據(jù)集,擁有數(shù)百萬張帶標簽的圖像,涵蓋數(shù)千個類別,而不僅僅是 101 個,對吧?1500萬張帶標簽的圖像。1500萬張已標注圖像。謝謝你,李飛飛。這促成了深度學習領域的驚人突破,特別是 AlexNet,以及計算機視覺領域整體的巨大進步。是的,極大地推動了機器視覺的發(fā)展。
李飛飛
: 我還記得在 2016 年或 2017 年,我曾經(jīng)展示一張幻燈片,內(nèi)容是人工智能的歷史,或者,你知道的,那時主要是卷積神經(jīng)網(wǎng)絡 (CNN) 和循環(huán)神經(jīng)網(wǎng)絡 (RNN),生成對抗網(wǎng)絡 (GAN) 才剛剛興起。我把 ImageNet 和 AlexNet 看作是人工智能發(fā)展史上具有開創(chuàng)意義的時刻之一,是定義人工智能進步的極少數(shù)事件之一。顯然,現(xiàn)在我們有了 Transformer 模型,或許還有擴散模型之類的,但那(ImageNet和AlexNet)確實是一個巨大的突破。
李飛飛
: 是的,謝謝。另一個讓我非常自豪的時刻是安德烈(指 Andrej Karpathy)和賈斯汀·約翰遜的畢業(yè)論文。在我看來,那是語言和圖像首次通過為視覺世界添加標題和編寫故事而融合的時刻,這對我來說意義重大,原因有兩點。
其中之一是我真的以為,我可沒開玩笑,在我的博士生涯結(jié)束時,我認為如果我能活到100歲,那才是我們或許能夠解決的問題。也就是圖片的敘事。所以我進入我的職業(yè)生涯,就像我第一年當助理教授一樣,心想著,好的,我要做ImageNet來解決物體識別問題。然后我將用我余下的整個職業(yè)生涯來解決這個敘事問題。然后當Andrej,以及稍晚些的Justin Johnson進入我的實驗室時,那是大約2013年、2014年,深度學習的開端。然后突然間,序列模型的組合,當時是LSTM,還不是Transformer模型,但是LSTM和CNN就這樣炸開了花。圖像描述工作,Andrej和我的工作與谷歌的工作一起,是最早完成并發(fā)布的。那對我來說真的是,我?guī)缀醺械剑屛胰绱俗院溃規(guī)缀醺械搅艘粓鑫C,就像,我將在余下的70年或65年里做些什么呢?所以這真的令人興奮,這個領域發(fā)展得如此之快,你知道的,發(fā)展得如此之快。
對研究者的建議:無所畏懼
Sarah
: 我可以再問你一個關于這個問題的問題嗎,就因為你已經(jīng),你知道的,取得了如此驚人的進展,而且非常高效,對吧?就像你我之前在線下談過的那樣,你覺得在人工智能研究領域存在超越大型企業(yè)資助實驗室的登月計劃和創(chuàng)造力,這一點非常重要,對吧。而且,你知道,你指出了幾個時刻,它們來自于創(chuàng)造力以及學術界的研究,你對人們有什么建議,關于是否仍然存在這種機會?或者,你知道,從現(xiàn)在開始,一切都只是 100 億美元的訓練運行了。
李飛飛
: 我唯一的建議,我仍然在我的公司、我的實驗室里這樣說,就是要無所畏懼。我認為科學家、技術專家和企業(yè)家都必須無所畏懼。你知道,最終你必須弄清楚,你是否需要 100 億美元的運行?或者到那時你來找莎拉申請資金。可能兩者都需要很多。是的。或者你必須弄清楚,你知道,我不知道,數(shù)據(jù)方面的問題。有時候,無畏是一種非常有趣的狀態(tài),你可能有點妄想和瘋狂,但也可能僅僅是理性上的大膽。它介于兩者之間。因為如果你過于理性,就顯得不夠勇敢。你就無法發(fā)現(xiàn)足夠大的問題。但如果你完全瘋癲,那么我不知道,可能會出現(xiàn)很多問題。所以要無畏。要勇敢。對我來說,即使我已經(jīng)這么老了,我仍然是這樣感覺的。我創(chuàng)辦了我的初創(chuàng)公司W(wǎng)orldLabs,是因為我想無畏地解決空間智能這個問題。
Sarah
: 作為解決問題的一部分,隨著時間的推移,你已經(jīng)與世界上一些最好的AI研究人員和最好的工程師合作。
招募無畏者:構(gòu)建多元化團隊
李飛飛
: 你如何在你公司的背景下看待這件事?比如,你們正在嘗試招聘哪種類型的人?目前有空缺職位嗎?還有,數(shù)據(jù)看來這是一支非常棒的團隊。我只是好奇,你們想增加哪種類型的人,以及你們?nèi)绾坞S著時間的推移考慮這件事?
李飛飛
: 是的,我們有空缺職位,并且目前我們非常希望為公司招聘最優(yōu)秀的工程師以及產(chǎn)品思考者。所以,如果你是一名工程師、人工智能研究員或產(chǎn)品人才,并且熱衷于加入最有才華的團隊并解決這個問題,請加入我們。
那么,我們招聘什么樣的人呢?首先,我們確實招聘具有思維多樣性的人。這就是為什么,你知道,你們稱我們?yōu)槿斯ぶ悄芄荆绻闵钊肓私猓覀儠l(fā)現(xiàn)我們有計算機圖形學專家。我們擁有計算機視覺專家。我們擁有數(shù)據(jù)專家。我們擁有,你知道的,生成式人工智能專家。我們擁有機器學習基礎設施專家。我們擁有優(yōu)化專家。因此,聘用多元化且真正有才華的團隊至關重要,因為像空間智能這樣艱巨的問題并非同質(zhì)化問題。解決這個問題需要來自各種背景的人才。然后我也尋找無畏精神。
李飛飛
: 你如何做到這一點?例如,你如何識別某人的背景或思維過程中是否具有無畏精神?
李飛飛
: 這是他們的背景決定的。你和他們交談。你能感覺到某人是否無所畏懼。你知道,你能感覺到是什么驅(qū)動著他們。你知道,你能感覺到他們提出的問題。如果他們開始問你很多關于,我不知道如何完成這件事的問題。我的意思是,當然,你必須問這些問題,因為你想完成它。但如果你感覺到這來自于害怕解決問題的角度,那就不是無所畏懼。但那些無所畏懼的人,他們富有創(chuàng)造力。他們有雄心壯志。他們并不畏懼不確定性或未知。我真的很喜歡這一點。
終極愿景:以人為本的人工智能
Sarah
: 嗯,我想阿拉德和我,你知道,我們努力做與無畏之人做生意的生意,并且希望那些人在技術上富有創(chuàng)造力。最后一個更廣泛的問題想問您,因為我認為您工作的一個重要部分也在于思考如何將更多人引入人工智能領域,您知道,共同指導斯坦福以人為本人工智能中心。如果您設想一下,您知道,不是為了用書開玩笑,但如果您設想一下幾年后,在您上一組預測之后的世界,您對以人為本的人工智能最樂觀的看法是什么?
李飛飛
: 是的,謝謝您提問。事實上,我職業(yè)生涯中另一點讓我感到非常自豪的是創(chuàng)立了以人為本人工智能研究所,HAI,以及不斷朝著這種思維方式邁進。我想構(gòu)建一個人工智能協(xié)作并賦能于人的世界。我仍然相信我們的世界,我們?nèi)祟惖氖澜缧枰匀藶楸荆阒溃谀抢铮瑦邸㈥P系,以及各個社群的繁榮。這些都非常重要,公正也是,這些都是非常重要的價值觀。而且我認為任何機械裝置,無論是人工智能、飛機還是生物技術,都不應該剝奪這些。但考慮到那些關鍵價值觀,擁有人工智能來賦能我們真的非常重要,因為有太多尚未解決的問題。
我曾經(jīng)工作過的一個應用領域是醫(yī)療保健,例如在斯坦福大學,對吧?如果你看看醫(yī)療保健,從藥物發(fā)現(xiàn)到治愈疾病,到能夠覆蓋全世界人民的診斷,到能夠讓全世界人民都能獲得的治療,再到整個醫(yī)療保健服務,如何讓老齡化變得更好,如何照顧慢性疾病,如何處理精神健康,所有這些,我們不存在人類過剩之類的問題。我們?nèi)狈椭D阒溃覀內(nèi)狈茖W發(fā)現(xiàn),我們?nèi)狈υ\斷,我們?nèi)狈珳梳t(yī)療,我們?nèi)狈Ω踩行У尼t(yī)療保健服務和老齡化幫助等等。而這就是我相信的。我認為人工智能是幫助人們的工具。
Sarah
: 是的,我認為我和很多人共同投資了一系列公司,我希望這些公司能在這方面發(fā)揮作用,從架橋到開放證據(jù)再到后期。但是正如你所說,存在著一個巨大的問題譜系。老實說,過去15年來,我對普遍的技術和醫(yī)療保健領域的應用并不那么樂觀。但這一次感覺確實不一樣。實際上,這絕對是一件整體利大于弊的事情。
李飛飛
: 是的,實際上在此之前我創(chuàng)辦了一家數(shù)字健康公司。
Sarah
: 我希望,人們談論了幾十年的很多事情最終能夠?qū)崿F(xiàn)。
李飛飛
: 看起來人工智能是實現(xiàn)這一目標的絕佳傳遞機制。
Sarah
: 完全同意。好的,非常感謝您,飛飛。
李飛飛
: 太棒了。
Sarah
: 這次談話令人鼓舞,并且很高興更多地了解了世界實驗室。非常感謝。
李飛飛
:謝謝你,莎拉。非常感謝你邀請我。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.