未經許可不得轉載,保留原文出處鏈接和公眾號按鈕
(關注本城公眾號并設為標,
第一時間獲取最新世界頂級科技認知)
文:Web3天空之城·城主
前言:
老黃在今天早上的SIGGRAPH2024上毫無意外再度成為萬眾矚目的明星主角:一場主持人完全不存在的主旨訪談(演講),以及老黃與他力邀前來的Meta馬克·扎克伯格現場爐邊對話。
上下兩場一共2小時全文三萬字,這里和讀者分享精校視頻以及書面全文完整版:
主旨訪談:
B站傳送:NVIDIA黃仁勛 SIGGRAPH2024現場主旨訪談 07.30 【中英】-嗶哩嗶哩】 https://b23.tv/q1IAUIl
老黃和小扎爐邊對話:
B站傳送:黃仁勛對話馬克·扎克伯格 @SIGGRAPH2024 2024.7.30【中英】-嗶哩嗶哩】 https://b23.tv/NtVUDP2
=黃仁勛主旨訪談書面完整版=:
主持人:歡迎來到 SIGGRAPH。這是我第一次參加這個會議,我非常高興能來到這里,與大家交流,特別是與 NVIDIA 的創始人兼首席執行官 Jensen Huang 進行對話。謝謝大家,很高興見到你們。
老黃:歡迎來到 SIGGRAPH,Lauren。謝謝,歡迎來到我的社區。
主持人:你是這里的常客。
老黃:大家好,很高興見到你們。我穿了一件全新的皮夾克。
主持人:哦,全新的?你有多少件?
老黃:我不知道,但 Lori 給我買了一件 SIGGRAPH 的新夾克。她說,你對 SIGGRAPH 很興奮。這是一件新夾克。加油,好好干。我看起來很敏銳。謝謝。
主持人:
好的,你與 SIGGRAPH 合作了很長時間。當你回想這個會議的歷史,自 1974 年以來一直在舉辦,再回顧 NVIDIA 從 1990 年代以來的歷史,你的 DNA 真的融入了計算機圖形學,幫助制作精美的圖形。NVIDIA 今天參加像 SIGGRAPH 這樣的會議有什么意義?
老黃:
SIGGRAPH 曾經是關于計算機圖形學的,現在它涵蓋了計算機圖形學和生成式人工智能。它涉及模擬和生成式人工智能。我們都知道,NVIDIA 的旅程從計算機圖形學開始,真正把我們帶到了今天。所以我為你做了一個動畫片,關于我們旅程的動畫片。
是你做的還是生成式人工智能做的?我做了它。這就是 CEO 們所做的,我們什么也不做,只是讓它完成。嘿,伙計們,如果我們有一幅動畫片,描繪了計算機行業一些最重要的里程碑,以及它如何引領 NVIDIA 以及我們今天所處的位置,那不是很棒嗎?所以我們描繪了……而且是在三個小時內完成的。非常感謝。而且是在三個小時內完成的,對吧。
這幅動畫片真的很棒。這些是計算機行業一些最重要的時刻:IBM System 360,當然,現代計算的發明;茶壺,1975 年;猶他茶壺,1979 年;光線追蹤。Turner Whitted 是一位偉大的研究人員,長期擔任 NVIDIA 的研究員。1986 年,他提出了可編程著色的概念。如果沒有可編程著色,我們今天看到的大多數動畫電影都不可能實現。最初,這項技術是在 Cray 超級計算機上完成的。
1993 年,NVIDIA 成立,Chris和我共同創立了這家公司。1995 年,Windows PC 的出現徹底改變了個人電腦行業,每個家庭和辦公桌上都有了一臺個人電腦,多媒體 PC 也隨之被發明。2001 年,我們發明了第一款可編程著色 GPU,這在很大程度上推動了 NVIDIA 的發展。
我們所做的一切都是以加速計算為背景。我們相信可以創建一種增強通用計算的計算模型,從而解決普通計算機無法解決的問題。我們首先選擇的應用程序是計算機圖形學,這可能是我們做過的最好的決定之一,因為計算機圖形學的計算密集程度極高。從計算機圖形學誕生之日起,它就需要一臺 Cray 超級計算機來渲染一些原始場景,這在某種程度上說明了其計算密集程度和容量的巨大。
我們將計算機圖形學應用于當時還不是主流的應用程序——3D 圖形視頻游戲。龐大的規模和復雜的計算問題導致我們需要投入巨大的研發預算,這推動了我們公司的飛輪。我們在 1993 年做出的觀察是正確的,這讓我們能夠在加速計算領域開創先河。
我們嘗試了很多次,CUDA 當然是革命性的版本。但在此之前,我們有一個稱為 CG 的計算模型,C 代表圖形,C 位于 GPU 之上。所以我們一直在加速計算方面工作,推廣和宣傳 CUDA,讓 CUDA 無處不在,并將其放在我們每一個 GPU 上。這樣,這個計算模型就可以與為其編寫的任何應用程序兼容,無論我們的哪一代處理器。這是一個偉大的決定。
2012 年的一天,我們進行了第一次接觸——星際迷航與人工智能的第一次接觸。第一次接觸是 AlexNet,那是在 2012 年。那是一個非常重要的時刻。我們觀察到 AlexNet 是計算機視覺領域的一個令人難以置信的突破,但從本質上講,深度學習意義深遠。這是一種編寫軟件的新方法,工程師不再提供輸入并想象輸出結果,而是編寫算法。我們現在有了一臺計算機,給定輸入和示例輸出,它就會找出中間的程序是什么。這一觀察,以及我們可以用這種技術解決一大堆以前無法解決的問題,是一個偉大的發現。我們改變了公司的一切以追求它。從處理器到系統,再到軟件堆棧,所有的算法,NVIDIA 基礎研究轉向深度學習。順便說一句,這是一個很棒的研究場所。
如您所知,NVIDIA 對 SIGGRAPH 充滿熱情。今年我們有 20 篇論文處于生成式 AI 和模擬的交叉點。2016 年,我們推出了第一臺為深度學習打造的計算機,我們稱之為 DGX-1。我在公司外交付了第一臺 DGX-1。我為 NVIDIA 構建了它,用于為自動駕駛汽車和機器人等構建模型,以及用于圖形的生成式 AI。有人看到了 DGX-1 的示例。Elon 聯系我說,他很想為他們正在創辦的一家初創公司擁有其中之一。所以我將第一個交付給了當時沒人知道的一家名為 OpenAI 的公司。那是 2016 年。
2017 年是徹底改變現代機器學習、現代深度學習的一年。2018 年,就在 SIGGRAPH 上,我們宣布了 RTX,這是世界上第一個實時交互式光線追蹤器、光線追蹤平臺。我們稱之為 RTX。這是一個大事件,我們將 GTX(每個人都稱我們的圖形車為 GTX)的名稱更改為 RTX。再次向一位偉大的研究人員致敬。他的名字是 Steven Parker。你們很多人都知道他已經參加 SIGGRAPH 很久了。他今年去世了。他是實時光線追蹤背后的核心先驅研究人員之一。我們非常想念他。
去年您在 SIGGRAPH 主題演講中提到,RTX(Ray Tracing Extreme)是計算機圖形與 AI 相遇的重要時刻之一。但實際上,這種情況已經發生了一段時間。那么 2018 年的 RTX 有什么重要意義呢?
2018 年的 RTX,我們加速了光線遍歷和邊界框檢測,并且我們可以使用并行處理器來加速光線追蹤。但即便如此,我們的光線追蹤速度大約是每秒一幀,比如說,每秒 10 幀。可能每秒五幀,這取決于我們談論的追蹤光線數量。我們以 1080 分辨率進行追蹤。顯然,視頻游戲需要的遠不止這些。顯然,實時圖形需要的遠不止這些。
這群人肯定知道這意味著什么。但對于那些在線觀看、不從事該領域的人來說,這基本上是一種在計算機圖形中真正操縱光線的方法,模擬光線如何與環境互動,栩栩如生。在制作動畫時,渲染過程通常需要很長時間。
過去,Cray超級計算機只能渲染幾個像素。現在,我們有了RTX來加速光線追蹤,但它是交互式的、實時的,速度還不足以用于視頻游戲。因此,我們意識到需要一個大的提升,可能提升20倍左右,甚至50倍左右。
為此,團隊發明了DLSS,它基本上是渲染一個像素,同時使用AI推斷出其他大量像素。我們教了一個AI,根據它所看到的內容,為其他所有部分填充像素。現在,我們能夠以4K分辨率和每秒300幀的速度渲染完全光線追蹤、完全路徑追蹤的模擬,這要歸功于AI。
2018年到來了,2022年,ChatGPT問世了。ChatGPT是OpenAI推出的一項革命性的新功能,是AI和歷史上增長最快的服務。自ChatGPT以來,業界和研究人員已經弄清楚了如何使用AI來學習一切,不僅僅是單詞,還包括圖像、視頻、3D、化學物質、蛋白質、物理學、熱力學、流體力學和粒子物理學的含義。AI已經理解了所有這些不同模態的含義。
從那時起,我們不僅學會了它,現在還可以生成它。這就是為什么你可以從文本生成圖像、3D模型、視頻,甚至蛋白質和化學物質。生成式AI已經成為可能,這確實是我們所處的革命性時代。幾乎每個行業都會受到影響,無論是科學計算、天氣預測、圖像生成,還是工業數字化生成虛擬場景。機器人和自動駕駛汽車也將通過生成式人工智能進行變革。
我們現在處于一種全新的做事方式中。勞倫,讓我快速介紹一下我們從哪里開始。1964年,軟件的編程方式是由人類工程師編寫軟件。現在,我們的機器正在學習如何編寫軟件,編寫人類無法編寫的軟件,解決我們以前幾乎無法想象的問題。因為有了生成式人工智能,我們有了一種開發軟件的新方法。
你知道Andrej Karpathy嗎?他是一位非常出色的研究員。我在斯坦福大學時認識了他,他創造了開發軟件的原始方式,軟件1.0,而機器學習是軟件2.0。我們現在正走向軟件3.0時代,這一切都得益于生成式人工智能。在未來,研究人員不再需要為每個新項目從頭開始學習機器學習,而是可以從預先訓練的基礎模型開始。這些模型已經經過大量訓練,具備了廣泛的知識和能力。
開發軟件的方式也在發生變化,越來越像是組建一支由各種人工智能專家組成的團隊。這些專家有的使用工具,有的能夠生成特定內容,還有一個通用人工智能,擅長推理和連接整個人工智能網絡,解決團隊面臨的問題。因此,軟件3.0已經到來。
最近與你交談時,我感受到你對生成式人工智能工具的未來持樂觀態度。你認為這些工具將變得更可控、更準確。我們都知道,目前存在幻覺、低質量輸出等問題,用戶可能無法得到他們期望的結果。同時,這些工具消耗大量能源,我們也需要討論這一點。你為什么如此樂觀?你認為是什么推動生成式人工智能變得更加有用和可控?
ChatGPT的重大突破在于強化學習人類反饋,即利用人類來產生正確或最佳答案,使人工智能與我們的核心價值觀保持一致,或與我們希望它執行的技能保持一致。這可能是他們能夠向所有人開放ChatGPT的非凡突破。從那時起,其他突破也隨之而來。
首先是護欄技術,它使人工智能將精力或反應集中在特定領域,避免走神或對各種問題發表長篇大論。它只會專注于被訓練過的內容、適合執行的任務以及它擁有深厚知識的領域。
第二個突破是檢索增強生成技術,它基本上是將數據矢量化或嵌入,以便我們理解這些數據的含義。
這是一個更權威的數據集。
超越了訓練數據集,實際上從其他來源提取數據。例如,它可能是你寫過的所有文章和論文。這樣,它就變成了一個對你有權威的人工智能,可能是你的聊天機器人。
因此,我寫過或說過的所有內容都可以矢量化,然后創建到語義數據庫中。在AI做出響應之前,它會查看你的提示,并從該矢量數據庫中搜索適當的內容,然后在生成過程中對其進行擴充。這三種技術的結合確實使我們能夠對文本進行這種操作。
現在,真正酷的是,我們開始弄清楚如何用視覺效果做到這一點。SIGGRAPH大會確實與圖像和生成有很大關系。如果你查看當今的生成AI,你可以給它一個提示,然后它會生成相應的內容。在這個特定情況下,這是NVIDIA創建的Edify AI模型,這是一個2D、文本到2D的基礎模型,它是多模式的。我們與 Getty 合作,使用他們的數據庫來訓練 AI 模型。這是一個從文本到二維圖像的過程。這張幻燈片是我親自制作的。想象一下,如果我是提示,然后有一個團隊類似于生成式人工智能,神奇地生成了這張幻燈片。這是一個提示,可能是給某個品牌所有者的提示。在本例中,它可能是可口可樂的品牌,也可能是一輛汽車、奢侈品或其他任何東西。你使用提示生成圖像,但如你所知,很難控制這個提示,它可能會產生幻覺,或者以某種你不想要的方式創建圖像。
使用文字來微調圖像非常困難,因為文字的維度非常低,內容極其壓縮且不精確。因此,我們很難控制生成的圖像。為了解決這個問題,我們創建了一種方法,使我們能夠控制和調整更多條件。我們的方法是創建另一個模型,例如,一個允許我們將文本轉換為三維的模型。最底層的模型叫做 Edify 3D,是我們的基礎模型之一。
我們創建了一個 AI 工廠,合作伙伴可以與我們合作,我們用他們的數據為他們創建模型。我們發明模型,他們帶來數據,我們創建一個他們可以隨身攜帶的模型。例如,Shutterstock 只使用他們的數據,這些數據用于訓練模型。現在,我們使用提示生成 3D 圖像,并將其放在 Omniverse 中。正如你所知,Omniverse 是一個可以從許多不同模態組合數據和內容的地方,包括 3D、AI、動畫和材料。
通過 Omniverse,我們可以組合所有這些多模態數據,并且可以控制它。你可以改變姿勢、位置和其他任何你喜歡的東西。然后你使用 Omniverse 中的圖像來調節提示,從 Omniverse 中獲取結果,并用提示來增強它。這有點像檢索增強生成,即 3D 增強生成。經過訓練的模型是多模態的,理解圖像和提示,并將其組合起來創建新圖像。這樣,我們就可以使用生成式人工智能作為合作者,按照我們喜歡的方式生成圖像。
這如何轉化為物理世界?它如何轉化為機器人之類的東西?
我們將談談機器人技術。但有一件事我很想向你展示,這不是我自己做的。好吧。這是一個令人難以置信的視頻,是 WPP、Shutterstock 與一些世界知名品牌合作完成的作品。讓我們播放視頻。
視頻畫外音:“在空房間里為我建一張桌子,周圍放置椅子。在一家繁忙的餐廳里,為我建一張有玉米餅和一碗莎莎醬的桌子。在晨曦中,在一條空曠的道路上為我建一輛汽車,周圍被樹木包圍。在一座現代化的房子旁邊,為我建一座遠處有山丘和一捆捆干草的房子。在傍晚的陽光下,在空曠的田野里為我建一棵樹,并在四面八方建數百棵樹,灌木叢和藤蔓懸掛在樹間。這難道不令人難以置信嗎?”
事情就是這樣的。我們教會了人工智能如何使用OpenUSD。于是,女孩開始與Omniverse對話。Omniverse生成USD,然后使用USD搜索其3D對象目錄,利用文字構建場景。生成式人工智能利用這種增強來生成和調節生成過程。因此,你的工作可以得到更好的控制。你甚至可以與他人合作,因為你可以在Omniverse中合作,在3D中合作。在2D中很難合作,所以我們可以在3D中合作,增強生成過程。
我想這個房間里的很多人不僅是技術人員,而且還是講故事的人。這是一個技術含量很高的房間。講故事的人看到了類似的東西。這里有90%的人是博士。想想……我甚至不會要求你們舉手,但我相信那會很有趣。所以他們看到了類似的東西,我也看到了類似的東西。我想,好吧,這真是太神奇了。你正在加快渲染時間,你正在憑空創造圖像。
可能還有許多人在想,這對我的工作意味著什么?你如何區分這是增強還是幫助人們?您認為界限在哪里?
這正在取代人類所做的某些事情。這就是工具的作用。我們在這里發明工具。這次會議是關于發明最終成為工具的技術。這種工具要么加速我們的工作,要么與我們合作,以便我們可以做得更好甚至更大,完成以前不可能完成的工作。
所以我認為你可能會看到,生成式人工智能現在將比以前更易于控制。我們已經能夠通過使用regs、檢索增強生成來更好地控制文本生成,減少幻覺。現在我們正在使用Omniverse和生成式人工智能來更好地控制生成圖像并減少幻覺。這兩種工具都幫助我們提高工作效率,做我們原本無法做的事情。
因此,我想對世界上所有的藝術家們說的是,利用這個工具,嘗試一下,想象一下你將能夠用這些工具講述的故事。至于工作,我想說,我們所有人的工作都很有可能發生變化。
以什么方式?我的工作將會改變。
未來,我將推動一大批人工智能的發展。每個人都會擁有一個人工智能助手。因此,每家公司、公司內的每個工作崗位都會擁有人工智能助手。正如你所知,我們的軟件程序員現在擁有幫助他們編程的人工智能。我們所有的軟件工程師都有幫助他們調試軟件的人工智能。我們有人工智能幫助我們的芯片設計師設計芯片。沒有人工智能,Hopper 和 Blackwell 就不可能實現。
今天,本周,我們正在向世界各地發送 Blackwell 的工程樣品。它們現在就在人們的椅子下面。我想如果你看看,你會發現你得到了一個 GPU。是的,你得到了一個 GPU。供應鏈方面,我們都希望如此。
因此,如果沒有生成式 AI,我們所做的任何工作都不可能再實現。我們的 IT 部門正在越來越多地幫助員工提高工作效率。我們的供應鏈團隊正在越來越多地優化供應,以盡可能提高效率。我們的數據中心團隊也在使用 AI 來管理數據中心,以盡可能節省能源。
你之前提到過 Omniverse。這不是什么新鮮事。但 Omniverse 中將有更多生成性 AI,幫助人們創建這些模擬或數字孿生。
是的,順便說一下,這就是我們本周宣布的內容。Omniverse 現在可以將文本理解為 USD。它可以理解文本并擁有語義數據庫,因此它可以搜索所有 3D 對象。這就是那位年輕女士能夠用一大堆樹填滿場景的原因。她描述了希望如何組織樹木,并以某種方式用所有這些 3D 樹填充它。完成后,該 3D 場景將進入生成式 AI 模型,并將其轉變為逼真的模型。如果你希望福特卡車不進行增強,而是使用實際的品牌基礎事實,那么它會尊重這一點,并將其保留在最終場景中。
我們討論的一件事是公司中的每個團隊都將如何獲得人工智能的幫助。最近有很多問題,關于我們正在構建的所有這些基礎設施是否會促進公司的工作效率。我剛剛給你舉了一個例子,說明如果沒有生成式人工智能,NVIDIA 的設計就不可能實現。所以我們用它來改變我們的工作方式。
在我剛剛向你展示的許多例子中,我們也用它來創造新產品和新技術,這些產品和新技術要么使實時光線追蹤成為可能,要么使我們現在可以想象的 Omniverse 幫助我們創造更大的場景,要么使我們的自動駕駛汽車工作,要么使我們的機器人工作。如果沒有它,所有這些新功能都不可能實現。
因此,我們本周在此宣布的一件事是數字代理、數字 AI 的概念,它將增強公司中的每一項工作。人們發現的最重要的用例之一就是客戶服務。每個團體、每個公司都有客戶服務,每個行業也都有客戶服務。在今天,客戶服務主要由人類完成,但在未來,我猜測仍然會是人類主導,但會有AI的參與。
這樣做的好處是,您將能夠保留所有客戶服務代理的經驗,并獲取機構知識,然后將其用于分析,從而為客戶創建更好的服務。
剛才我向您展示了Omniverse增強圖像生成。這是一種RAG(檢索增強生成AI)。我們正在創建的客戶服務,基本上是位于云端的微服務。我認為它今天或明天就可以使用了,您可以來嘗試一下。
我們將一個數字人前端連接到它,基本上是一個IO(輸入輸出),一個能夠說話、與你眼神交流、以共情的方式進行動畫處理的人工智能IO。您可以決定將您的ChatGPT或人工智能連接到數字人,或者將您的數字人連接到我們的檢索增強生成客戶服務人工智能。
無論您喜歡怎么做,我們都是一家平臺公司,所以無論您想使用哪個部分,它們都是完全開源的,您可以選擇使用您喜歡的部分。如果您想要我們為渲染美麗的面孔而創建的令人難以置信的數字人渲染技術,這需要使用路徑跟蹤的次表面散射,那么這一突破真的相當不可思議。
這讓我們能夠實現出色的圖形研究。歡迎來到SIGGRAPH 2024。因此,使用AI制作動畫成為可能。您可以與AI聊天,它會生成文本,然后將文本轉換為聲音,再將文本轉換為語音,再將語音轉換為聲音,然后為面部添加動畫,最后通過RTX路徑跟蹤渲染數字人。
所有這些都可供開發人員使用,您可以決定要使用哪些部分。
您如何看待這樣的道德問題?您正在向開發人員、圖形藝術家發布這項技術,但這些技術正在被推向世界。您認為像這樣的聊天機器人,一個非常像人類的視覺聊天機器人,應該明確說明它是一個聊天機器人嗎?它是否太像人類以至于人們開始誤以為它是人類?他們在情感上容易受到聊天機器人的影響。
它仍然非常像機器人,我認為這并不是一件可怕的事情。我們將在一段時間內成為機器人。我認為我們已經讓這項數字人技術變得非常逼真,但你我都知道它仍然是一個機器人。所以我認為這并不是一個糟糕的方法。
事實上,在很多不同的應用中,人類的參與更有吸引力。擁有一個人類代表或接近人類的代表,而不是一個文本框,可能更有吸引力。也許有人需要陪伴,或者醫療保健需要為剛回家的門診病人提供建議,幫助老人。這些都有很多應用場景。教育孩子的導師也是一個很好的例子。
所有這些不同的應用程序最好有一個更人性化的人,能夠與觀眾建立聯系。
這很有趣。我聽到您今天經常談論的是軟件開發。他們依賴于你的GPU,但最終這是軟件。這是NVIDIA進一步向上發展的方向。與此同時,有些公司在生成AI領域從事軟件和云服務,但他們希望進一步向下發展,可能正在開發自己的芯片或TPU,與NVIDIA競爭。這種軟件戰略對于NVIDIA保持領先地位并實現人們對NVIDIA的增長預期有多重要?
我們一直是一家軟件公司,甚至是第一家。原因在于加速計算不是通用計算。通用計算可以采用任何C程序、C++程序、Python并運行它,幾乎每個人的程序都可以編譯并有效運行。不幸的是,當您想要加速流體動力學時,您必須了解流體動力學的算法,以便重構它以實現加速。您必須設計一個加速器,設計CUDA GPU,使其了解算法,以便能夠很好地加速它。
這樣做的好處是,通過重新設計整個堆棧,我們可以將應用程序加速20、40、50倍,甚至100倍。例如,我們剛剛將NVIDIA GPU放入GCP中,運行Pandas,這是世界領先的數據科學平臺。我們的速度比通用計算快了50到100倍。就深度學習而言,在過去10到12年里,我們將深度學習的速度提高了一百萬倍。這就是我們現在能夠創建這些大型語言模型的原因。速度提高了一百萬倍,成本和能源降低了一百萬倍,這使我們能夠實現生成式人工智能。
但這是通過設計一種新的處理器、一種新的系統、Tensor Core GPU、NVLink交換結構來實現的,這對于人工智能來說是完全開創性的。當然,系統本身、算法、我們稱之為Megatron的分布式計算庫(每個人都在使用)、Tensor RT、LLM,這些都是算法。如果你不了解算法和上面的應用程序,就很難弄清楚如何設計整個堆棧。
NVIDIA軟件生態系統中對NVIDIA未來最重要的部分是什么?
每一個領域都需要一個新的庫,我們稱之為DSL,即領域特定庫。在生成式AI中,該DSL稱為CUDNN。對于SQL處理數據幀,它被稱為CUDF。因此,如果您使用SQL、Pandas,CUDF使我們能夠加速這一過程。對于量子模擬,它被稱為QQuantum。QFFT,我們有很多Q。計算光刻,這使我們能夠幫助行業推進下一代工藝技術QLitho。Q的數量還在不斷增加。每次我們引入領域特定庫時,它都會將加速計算推向新市場。因此,需要這種協作、完整的庫堆棧、架構、上市、開發人員和周圍的生態系統來開辟一個新領域。這不僅僅是構建加速器,還必須構建整個堆棧。
NVIDIA 依賴于許多事情的順利進行。你的未來探索和創新也依賴于許多事情的順利進行。你必須繼續推動物理定律,因為你的競爭對手總是緊隨其后。我們已經討論過這個問題,是什么讓你夜不能寐。你也在一定程度上依賴地緣政治的穩定。
昨晚,我因為海拔問題感到不適,喝了點水,但為時已晚。當我今天早上得知這件事時,我醒來時頭痛欲裂。海拔問題確實影響了我(觀眾笑)
但實際上,你必須繼續推動物理定律。你的競爭對手總是緊隨其后,無論是在軟件方面還是硬件方面。你在一定程度上依賴南海的地緣政治穩定。地緣政治現在發生了很多事情。
你提醒了我,建立一家公司非常困難。你讓我很緊張,我以前還好。我們還有很多事情要做。我正在給你看幻燈片。
說實話,你經歷了很多順風。你對事情會繼續朝著你的方向發展有多樂觀?
事情從未朝著我們的方向發展。你必須將未來變為現實。
加速計算,世界需要通用計算。原因是它很容易。你只需要軟件,它每年的運行速度就會翻倍。甚至不要考慮它。每五年就快十倍,每十年就快一百倍。有什么不喜歡的?但是,當然,你可以縮小晶體管,但不能縮小原子。最終,CPU架構走到了盡頭。因此,通用儀器可以擅長一切,這已經不再明智了,因為技術并沒有給我們帶來這些飛躍。它可以擅長從深度學習到量子模擬到分子動力學到流體動力學到計算機圖形學的這些令人難以置信的事情。因此,我們創建了這個加速計算架構來實現這一點。
但那場戰斗,那是逆風。你明白我的意思嗎?因為通用計算是實現這一目標的簡單方法。我們已經做了60年,為什么不繼續做下去呢?因此,加速計算之所以成為可能,是因為我們提供了如此非凡的加速。在能源越來越稀缺的時代,在我們不再能僅僅依靠CPU曲線的時代,Dennard縮放定律已經真正終結了。因此,我們需要另一種方法,這就是我們在這里的原因。
但請注意,每次我們想要開拓一個新市場,比如QDF,為了進行數據處理,數據處理可能占世界計算的三分之一,每家公司都進行數據處理,大多數公司的數據都是數據框中的表格格式。為了創建表格格式的加速庫非常困難,因為這些表格中的內容可能是浮點數、64位整數,可能是數字和字母以及各種各樣的東西,所以我們必須想出一種方法來計算所有這些。幾乎每次我們想要發展成某種東西,都必須去學習它。這就是我們研究機器人的原因,也是我們研究自動駕駛汽車的原因。我們需要了解開拓該市場所必需的算法,了解其下的計算層,以便能夠提供非凡的結果。
每次我們開拓一個新市場,無論是醫療保健還是數字生物學,我們都需要重新發明計算的一切。例如,我們在基因測序方面使用了 BioNemo 和 Parabricks,取得了驚人的成果。因此,這并不容易。
你的工作非常辛苦。但人工智能助手會讓事情變得更容易。現在,讓我們談談能源問題。生成式人工智能非常耗能。根據一些研究,ChatGPT 處理一個查詢所消耗的電力幾乎是處理單個谷歌搜索的 10 倍。數據中心消耗全球總能源的 1% 到 2%,但有人說可能會高達 3% 到 4%,甚至到本世紀末可能會高達 6%。從 2015 年到 2019 年,數據中心的工作量增加了兩倍,而人工智能,特別是生成式人工智能,占據了其中很大一部分。
是否有足夠的能源來滿足我們想要構建和實現的目標?
是的。首先,幾年前只有兩三個或三四個模型制造商在推動前沿發展。今年,這個數字可能增加了三倍,但仍然是個位數,大約有十個模型制造商在推動模型的發展。模型的規模每年都會擴大一倍,甚至更快。為了訓練一個兩倍大的模型,需要兩倍以上的數據。因此,計算負荷每年可能增長四倍。
我們使用相同的能量加速了應用程序,這是一個以恒定的能量和成本加速應用程序的例子,使其越來越便宜。現在,重要的是,我只強調了 10 家公司。世界上有大量的公司和數據中心,NVIDIA 正在向許多公司出售 GPU。這標志著 CPU 擴展的結束,加速計算、數據處理、文本完成、語音識別等基本人工智能任務在全球數據中心的開始。每個人都在從 CPU 轉向加速計算,因為他們想節省能源。加速計算可以幫助節省大量能源,能夠以 20 倍、50 倍的效率完成同樣的處理。因此,作為一個社會,我們要做的第一件事就是加速我們能用到的每一個應用程序。如果你在進行 Spark 數據處理,那么就使用加速的 Spark 來運行,這樣可以將所需的能量減少 20 倍。如果你在進行 SQL 處理,那么就使用加速的 SQL,這樣可以將功耗減少 20 倍。因此,如果你在進行天氣模擬,就加速它。無論你在進行什么科學模擬,都要加速它。圖像處理也要加速。許多應用程序過去都在 CPU 和通用計算機上運行,所有這些在未來都應該加速發展。這是正在發生的第一件事。
那么,這是否會減少全世界使用的能源量?當然。我們的 GPU 密度和加速計算密度更高,能量密度更高,這是正在發生的第一件事。接下來是生成式人工智能。生成式人工智能可能正在消耗大約世界能源的 1%。但請記住,即使數據中心消耗了全球的 4%,生成式人工智能的目標也不是訓練,而是推理。通過推理,我們可以創建新的模型來預測天氣、預測新材料,優化供應鏈,減少交付產品時消耗的能源和浪費的汽油。因此,我們的目標實際上是減少 96% 的能源消耗。
因此,非常重要的是,你必須從縱向的角度來思考人工智能,不僅僅是上學,還要考慮上學后會發生什么。你和我都上過斯坦福大學。斯坦福并不便宜。不過,我認為你學的東西略有不同。是的,當然。這是一所大學校。這對你來說很好,對我們倆來說也很好。所以,目標當然是上學很重要,但真正重要的是畢業后,以及我們能夠為社會做出的所有貢獻。生成式人工智能將提高生產力,使我們能夠發現新科學,使事物更節能。
關于生成式人工智能我接下來要說的是,記住,傳統的計算方式稱為基于檢索的計算。一切都是預先錄制好的。所有故事、圖像和視頻都是預先錄制的,并存儲在某個數據中心。生成式人工智能減少了能源消耗。需要檢索某些內容并將其通過網絡傳輸。別忘了,數據中心并不是唯一消耗能源的地方。世界上的數據中心只占總計算量的 40%。60%的能源消耗在互聯網上,主要用于移動電子設備、比特和字節的傳輸。因此,生成式人工智能將減少互聯網上的能源消耗,因為我們不必去檢索信息,而是可以當場生成信息。我們的設備上可能已經有了一些內容,我們可以生成響應,這樣就不必去其他地方檢索它了。
此外,這其中的一部分也涉及到移動原子。最后我要告訴你一件事,記住,人工智能不在乎它在哪里上學。今天的數據中心建在社會所在的電網附近,因為那是我們需要它的地方。在未來,你會看到有多余的能源。將這些能源帶給社會需要花費很多錢。也許這些能源在沙漠里,也許在擁有大量可持續能源的地方,但這并不是很有吸引力,因為它們已經消耗了大量的水,而這些水很多是不能飲用的。
因此,我們可以使用這些水,將數據中心設在人口較少、能源較多的地方。我們已經說過,大量的能量來自太陽,世界上有很多能量。我們需要做的是將數據中心遷移到更靠近能源過剩的地方,而不是將所有數據中心都建在人口稠密的地方。人工智能并不關心它在哪里接受訓練。我以前從未聽過這句話,AI不在乎它在哪里上學,這很有趣。是的,這是真的,我會考慮一下。
不過,計算碳排放量的一部分是計算能源。不要將能源轉移到數據中心,而是在數據中心所在的地方使用能源。然后,當你完成后,你會有一個高度壓縮的模型,它本質上是所有使用過的能量的壓縮。我們可以采用該模型并將其帶回來。
接下來,我們可以談談下一波。
第一波,當然,第一波是加速計算。我知道她是采訪者,我們按照她的條件進行,但是,勞倫,我們需要告訴這個小組我們正在做的工作,這真的非常重要。
我有很多好問題要問你。我想問你關于開源的問題,我想你會和馬克談論這個話題。
順便說一句,開源真的很重要。這太不可思議了。是的,如果沒有開源,所有這些行業和公司如何能夠參與人工智能?
看看所有的公司和不同的行業,他們今天都在使用Llama 2。Llama 3.1剛剛問世,人們對此非常興奮。我們已經讓人工智能民主化,讓每個行業都參與到人工智能中來。但我想說的是,第一波是加速人工智能,它使我們能夠滿足持續的計算需求,而無需所有計算能力隨之增長。所以,第一,加速一切。它讓我們擁有生成式人工智能。生成式人工智能,第一波,當然是所有先驅者。我們知道,許多先驅者如OpenAI、Anthropic、谷歌和微軟等一大批了不起的公司都在致力于這項工作。X公司也在進行這項工作,X.AI公司同樣在進行這項工作。這些了不起的公司正在推動這一進程。
我們即將實現的下一波人工智能將應用于客戶服務領域,我們希望每個組織都能創建自己的人工智能系統。這樣,每個人都會得到增強,擁有一個可以賦予他們權力、幫助他們更好地工作的協作式人工智能。
接下來的下一波人工智能被稱為物理人工智能,這確實非常了不起。這就是我們需要三臺計算機的原因。一臺計算機用于創建,另一臺計算機用于模擬AI,兩者都使用合成數據生成,以及AI機器人、人形機器人或操控機器人可以學習如何改進其AI的地方。第三臺計算機則是實際運行AI的計算機。因此,這是一個三臺計算機的問題,也可以稱為三體問題。它非常復雜,我們創建了三臺計算機來解決這個問題。
我們制作了一個視頻,幫助您理解這一點。在每一臺計算機中,無論是使用軟件堆棧、頂層算法,還是計算基礎設施、機器人的處理器,或者在其上運行的功能安全操作系統,或者在其上運行的人工智能和計算機視覺模型,甚至僅僅是計算機本身的任何部分、任何層次,我們都會制作一個簡短的視頻。讓我們來看看。
視頻畫外音:物理人工智能時代已經到來。物理人工智能,即能夠理解并與物理世界互動的模型,將體現在機器人身上。許多將是人形機器人。開發這些先進的機器人非常復雜,需要跨各種計算基礎設施的大量數據和工作負載協調。
NVIDIA致力于通過三個計算平臺(NVIDIA AI、Omniverse和Jetson Thor)以及支持AI的生成式開發者工具來簡化和加速開發者工作流程。為了加速通用人形機器人基礎模型Project Root,NVIDIA研究人員捕捉人類演示,看到機器人的手在物理世界的空間疊加。然后,他們使用集成到NVIDIA iZakLab中的計算機模擬框架RoboCasa來生成大量環境和布局。他們使用MimicGenMim增加數據大小,這有助于他們根據少量原始捕獲生成大規模合成運動數據集。他們使用結合的真實和合成數據集在NVIDIA DGX Claude上訓練Groot模型。接下來,他們在Jetson Thor上執行軟件在環分析和硬件在環驗證,然后將改進的模型部署到真實機器人上。NVIDIA Osmo Robotics云計算編排服務在整個工作流程中管理跨分布式資源的作業分配和擴展。這些計算平臺共同賦能全球開發者,將我們帶入物理、人工智能驅動的時代。
在這次會議上,SIGGRAPH 是所有這些技術匯集的地方。無論是計算機圖形學、模擬、人工智能還是機器人技術,所有這些都在 SIGGRAPH 匯聚。這就是我認為你應該來 SIGGRAPH 的原因。
我很高興,也很激動。環顧四周,世界上 100% 的科技媒體都應該來 SIGGRAPH。我們可以支持這一點。昨晚我去展覽樓上看了一些藝術展品,真的很棒,特別是那個字面上的垃圾郵件機器人,不管是誰創建的。
在此之前,我聽過 SIGGRAPH Spotlight 播客,如果大家還沒有聽過,我真的推薦它。特別項目主席正在采訪幾位圖形設計傳奇人物,其中包括 David M.。David M. 討論了一件事:檔案。這對這群人來說是一個存在主義問題,但人們正在創造這種真正令人驚嘆的數字媒體,所有這些計算機圖形。你正在用你的技術加速它。它改變了人們構建一切的方式,面向未來。文件格式、檔案、訪問所有這些工作都面向未來。
機器人將繼續存在,我并不擔心他們會接管一切。人們正在創作的藝術呢?
這是一個存在的問題,也是一個非常好的問題。我們深信不疑的格式之一就是 OpenUSD。OpenUSD 是第一種將幾乎所有工具的多模態性整合在一起的格式,允許它們交互、組合在一起、進出這些虛擬世界。因此,理想情況下,隨著時間的推移,您可以將幾乎任何格式引入其中。
在這次會議上,我們宣布通用機器人數據格式 URDF 現在與 OpenUSD 兼容,或者可以將其引入 OpenUSD。因此,我們將把一種又一種格式都納入這種通用語言。使用標準是允許內容和數據共享、允許每個人協作并永久存在的最佳方式之一。例如,HTML。如果沒有 HTML,那么來自世界各地的所有這些不同內容都很難被所有人訪問。因此,在很多方面,OpenUSD 就是虛擬世界的 HTML。
我們也是這項計劃的早期推動者。有很多出色的公司加入了,還有許多其他公司正在加入。我的期望是世界上每一個設計工具都能夠連接到 OpenUSD。一旦連接到這個虛擬世界,您就可以在任何地方使用任何其他工具與任何人聯系,就像我們對 HTML 所做的那樣。
你說這個內容可以永遠存在。你要打造一個永遠存在的 Jensen AI 嗎?
當然,有一個 Jensen AI。事實上,我說過的一切,寫過的一切以及做過的一切,都可能被吸收到這些生成性工具中。我認為聰明的說法是正確的。
因此,Jensen AI 將來會負責召開您的財報電話會議。
但愿如此。這是必須要做的第一件事,也是機器人需要做的第一件事。
詹森,非常感謝你。我想我們可能很快就會被趕下舞臺了。但您很快就會和馬克·扎克伯格一起回來。謝謝大家,我們馬上回來。
=老黃和小扎爐邊對話書面完整版=
老黃:
女士們,先生們,我有一位非常特別的嘉賓。請大家坐下,我們即將開始。
我的下一位嘉賓給我留下了深刻的印象,原因有三。首先,只有少數企業家和創始人能夠創辦一家真正影響全球數十億人生活的公司,發明服務,并成為一家最先進的計算公司。其次,很少有企業家和創始人能夠創立一家市值超過一萬億美元的公司。第三,他是一位大學輟學生。這三件事同時成立。
女士們,先生們,請歡迎馬克·扎克伯格。
馬克,歡迎你第一次參加 SIGGRAPH。你能相信嗎?作為計算的先驅之一,現代計算的推動者,我不得不邀請他參加 SIGGRAPH。馬克,請坐。很高興你能來,感謝你飛過來。
小扎:
是的,這會很有趣。我聽說你已經走了五個小時了?
老黃:
是的,當然。這就是 SIGGRAPH,90% 的參與者都是博士。SIGGRAPH 的偉大之處在于,它是計算機圖形學、圖像處理、人工智能和機器人技術的結合。多年來,一些公司在這里展示了令人驚嘆的成果,包括迪士尼、皮克斯、Adobe、Epic Games,當然還有 NVIDIA,我們在這里做了很多工作。今年,我們在人工智能和模擬的交叉點上發表了 20 篇論文。我們正在使用人工智能來幫助模擬變得更大規模、更快,例如可微分物理。我們還在使用模擬來創建用于人工智能合成數據生成的模擬環境。這兩個領域真的走到了一起,我們為我們在這里所做的工作感到自豪。
在 Meta,你們做了令人驚嘆的人工智能工作。我覺得有趣的是,當媒體報道 Meta 近年來如何進軍人工智能領域時,提到了 FAIR 所做的工作。記住,我們都使用來自 Meta 的 PyTorch。你們在計算機視覺、語言模型、實時翻譯方面所做的工作都是開創性的。我想問的第一個問題是,您如何看待 Meta 當今生成式人工智能的進步?您如何應用它來增強運營或引入新功能?
小扎:
是的,有很多內容需要解答。首先,很高興來到這里。Meta 在 SIGGRAPH 工作了八年,所以與大家相比,我們是菜鳥。我記得那是在 2018 年,我們展示了一些早期的 VR 和混合現實頭戴設備的手勢追蹤工作。我們在編解碼器頭像方面取得了顯著進展,希望通過消費者頭戴設備實現照片級逼真的頭像,這一目標越來越近了。對此我感到非常興奮。
此外,我們還在顯示系統方面完成了許多工作。一些未來的原型和研究旨在使混合現實頭顯變得非常薄,但需要相當先進的光學堆棧和顯示系統,即集成系統。這些通常是我們首先展示的內容。因此,今年我很高興能來到這里,不僅僅是談論 Metaverse 的內容,還有所有的人工智能部分。
在創辦 Reality Labs 之前,我們創辦了 FAIR,即人工智能研究中心,當時是 Facebook,現在是 Meta。我們在這個領域已經工作了一段時間。圍繞生成式人工智能(Gen AI)的所有內容,都是一場有趣的革命。我認為它最終會以有趣的方式改變我們所有不同產品的運作方式。
我們已經擁有一系列大型產品,如 feed 和推薦系統,以及 Instagram 和 Facebook 等。我們不再僅僅是為了與朋友聯系。排名一直很重要,因為即使你只是關注朋友,如果有人做了一些非常重要的事情,比如你的表弟生了孩子,你希望它出現在最上面。如果它被埋在信息流的某個地方,你會很生氣。因此,排名很重要。
在過去幾年里,情況已經發展到更多的內容是公開的。推薦系統變得非常重要,因為現在不僅僅是幾百或幾千個來自朋友的潛在候選帖子,而是數百萬條內容。這變成了一個非常有趣的推薦問題。
有了生成式人工智能,我認為我們將很快進入一個新領域:你今天在 Instagram 上看到的大部分內容不僅是從世界上符合你興趣的內容中推薦給你的,不管你是否關注這些人。我認為在未來,很多這樣的內容也將使用這些工具來創建。一些將是創作者使用工具來創建新內容,另一些將是為你即時創建的內容,或者通過現有的不同事物匯集和合成的內容。
這是我們正在做的事情的核心部分將如何發展的一個例子。它已經發展了 20 年,但我認為這將繼續發展。
老黃:
很少有人意識到世界上有史以來最大的計算系統之一是推薦系統。
小扎:
這是一條完全不同的道路,并不完全是人們談論的那種生成式人工智能熱點,但它與建立越來越多的通用模型類似。
推動質量改進的一大因素是過去對每種類型的內容都有不同的模型。最近的一個例子是,我們有一個模型用于對卷軸進行排名和推薦,另一個模型用于對更長視頻進行排名和推薦。為了使系統能夠在線顯示任何內容,還需要進行一些產品工作。然而,你創建的通用推薦模型越多,它就會變得越好。這部分原因在于內容的經濟學和流動性。你可以從中獲取的內容池越廣,就不會遇到從不同池中獲取內容的低效率問題。隨著模型變得越來越大、越來越通用,情況會變得越來越好。
我夢想有一天,整個 Facebook 或 Instagram 都像一個單一的 AI 模型,將所有不同的內容類型和系統統一在一起。這些內容類型和系統在不同的時間范圍內有不同的目標,有些只是向你展示你今天想要看到的有趣內容,而有些則幫助你長期建立你的網絡,比如你可能認識的人或你可能想要關注的賬戶。
老黃:
這些多模態模型往往更擅長識別模式和弱信號。
AI 在你的公司中如此深入,真是太有趣了。你一直在構建 GPU 基礎設施,運行這些大型推薦系統。現在,我有點慢,實際上是在 GPU 方面。是的,我試圖表現得友善。你知道嗎?你是我的客人。
小扎:
在我來這里之前,你在后臺談論承認自己的錯誤或諸如此類的事情,所以你不必突然主動這么做。就好像被這篇帖子批評了一段時間一樣。但是一旦你進入這個狀態,你就會變得堅強。
老黃:
生成式人工智能最酷的地方在于,當我使用 WhatsApp 時,我感覺自己正在與 WhatsApp 合作。我喜歡 Imagine。我坐在這里打字,它會在我打字時生成圖像。我回去改一下措辭,它會生成其他圖像。比如,日落時分,一位中國老人和三只狗(金毛獵犬、金毛貴賓犬和伯爾尼山犬)一起享用一杯威士忌,它生成了一張非常漂亮的圖片。是的,每個月都在進步。這是上周的情況。對此非常興奮。
小扎:
現在,想象一下我。過去一周我花了很多時間和我的女兒們在一起,想象她們是美人魚之類的。這很有趣。很多新一代人工智能的東西將會是對我們長期以來擁有的所有工作流程和產品的重大升級。同時,現在將會有所有這些全新的東西可以被創造出來。因此,META AI,即在我們的世界中擁有一個能夠幫助你完成不同任務的人工智能助手的想法將非常具有創造性,就像你說的。但它們非常通用,所以你不需要僅僅將其限制在那里。它將能夠回答任何問題。
我認為,隨著時間的推移,當我們從 Llama 3 類模型轉向 Llama 4 及更高版本時,它將不再像聊天機器人那樣,你給它一個提示,它就會做出反應。然后你給它一個提示,它就會做出反應,就像來回一樣。我認為它會很快進化,你給它一個意圖,它實際上可以在多個時間范圍內消失。它可能應該承認你事先給了它一個意圖。但我認為有些東西最終會啟動,計算需要數周或數月的時間,然后當世界上發生某些事情時才返回給你。我認為這會非常強大。
老黃:
今天的人工智能,如你所知,是回合制的。你說些什么,它會回應你些什么。但顯然,當我們思考時,當我們被賦予任務或問題時,我們會考慮多種選擇,或者我們會想出一個選項樹,一個決策樹,然后我們沿著決策樹走下去,在腦海中模擬我們可能做出的每個決定的不同結果。所以我們在做規劃。在未來,人工智能也會做同樣的事情。
當你談到你對創造者人工智能的愿景時,我非常興奮的一件事,坦率地說,我認為這是一個本壘打的想法。告訴大家關于創造者人工智能和人工智能工作室的信息,它們將使你能夠做到這一點。
小扎:
是的,所以我們實際上……這是我們討論過的事情,我們今天要把它推廣得更廣泛。我們的很多愿景是……我不認為會只有一個人工智能模型,業內其他一些公司也這么做,他們正在構建一個中央代理。是的,我們將提供 MetAI 助手供您使用。但我們的愿景是,我們希望讓所有使用我們產品的人都能為自己創建代理。因此,無論是平臺上的數百萬創作者,還是數億小企業,我們最終都希望能夠整合您的所有內容,并快速建立業務代理,以便與您的客戶互動,做銷售和客戶支持等等。
所以我們現在開始推出的更多產品是我們稱之為 AI Studio 的產品。它基本上是一套工具,最終將使每個創作者都可以構建自己的 AI 版本,作為他們的社區可以與之互動的代理或助手。這里有一個根本問題,就是一天中的時間不夠用,如果你是一個創作者,你想更多地與你的社區互動,但你的時間有限。同樣,你的社區也想與你互動,但這很難,這樣做的時間有限。所以下一個最好的事情是允許人們基本上創造這些工件,它有點像一個代理,但你需要訓練它在你的材料上以你想要的方式代表你。我認為這是一種非常有創造性的努力,幾乎就像你在那里展示的一件藝術品或內容。很明顯,這種技術不會與創作者本身直接互動,但我認為這會是一種有趣的方式,就像創作者在社交平臺上發布內容一樣,代理也可以這樣做。
我認為,人們會為各種不同的用途創建自己的代理。有些代理將是某種定制的實用程序,用戶希望通過微調和訓練來完成特定任務。另一些代理則會用于娛樂,人們創造的一些東西可能很有趣,雖然有點傻,但以不同的方式展現了有趣的態度。我們可能不會將這些構建為META AI的助手,但我認為人們非常有興趣看到和互動。
一個有趣的用例是人們使用這些代理來提供支持。讓我有點驚訝的是,META AI的主要用例之一是人們用它來模擬他們將要遇到的困難社交場合。無論是在專業場合,比如詢問經理如何獲得晉升或加薪,還是在個人生活中,比如與朋友吵架或與女朋友遇到困難情況,這些代理提供了一個完全沒有判斷力的區域,用戶可以在其中扮演角色,看看談話會如何進行,并獲得反饋。
然而,很多人不想只與同一種代理互動,無論是META AI還是聊天GPT,還是其他人都在使用的代理。他們希望創造自己的代理。這就是我們對AI Studio的目標之一,但這也是我們更大觀點的一部分,即我們不應該只有一個與人們交互的大型AI。我們認為,如果這些不同的代理多樣化,世界將會變得更好、更有趣。
老黃:
如果你是一名藝術家,你可以將你的風格和所有作品拿出來,對其中一個模型進行微調,使其成為一個人工智能模型。然后,你可以提示它按照你的藝術風格創作一些東西,甚至可以給它一幅畫或素描作為靈感,它可以為你創作一些東西。未來,每家餐館、每個網站都可能擁有這些人工智能。
小扎:
我認為,在未來,就像每個企業都有一個電子郵件地址、一個網站和一個社交媒體賬戶一樣,每個企業都會有一個與客戶互動的人工智能代理。從歷史上看,有些事情很難做到。比如,客戶支持部門通常是與銷售部門分開的組織,而這并不是CEO希望的運作方式。雖然它們是不同的技能,但你正在建立這些大型系統。
我想,當你是 CEO 時,你必須做所有的事情。但當你將抽象概念融入組織時,很多時候組織是分開的,因為它們針對不同事物進行了優化。
我認為,柏拉圖式的理想是,它是一回事。作為客戶,你其實并不關心。當你試圖購買某樣東西時,你不希望有一條不同的路線,而當你購買的東西有問題時,你又不希望有一條不同的路線。你只是希望有一個地方可以回答你的問題,并能夠以不同的方式與企業互動。我認為這也適用于創作者。個人消費者方面將是與客戶的所有互動,尤其是他們的投訴,將使你的公司變得更好。
老黃:
事實上,這一切都與人工智能有關,這將捕捉機構知識和方法,所有這些都可以用于分析,從而改進人工智能等等。
小扎:
所以我認為這個商業版本有更多的集成,我們仍然處于相當早期的 alpha 階段。但是 AI 工作室讓人們可以創建他們的 UGC 代理和不同的東西,并開始讓創作者創建它們的飛輪。我對此非常興奮。
老黃:
那么我可以使用 AI 工作室來微調我的圖像集合嗎?
小扎:是的,我們會到達那里。
老黃:然后我可以把我寫的所有東西都加載進去,這樣你就可以把它當作我的抹布嗎?
小扎:
是的,基本上。然后每次我回到它時,它都會再次加載它的內存。所以它會記得上次停在哪里,我們繼續我們的對話,好像什么都沒發生過一樣。
就像任何產品一樣,它會隨著時間的推移變得更好。訓練它的工具會變得更好。這不僅僅是你想讓它說什么。我認為一般來說,創作者和企業也有一些他們想避開的話題,所以只是在所有這些方面做得更好。我認為這的柏拉圖式版本不僅僅是文本,您幾乎只希望能夠做到這一點,然后這與我們長期以來所做的某些編解碼器化身工作有所交集。您希望能夠與經紀人進行視頻聊天。我認為隨著時間的推移,我們會實現這一目標。我認為這些事情并不遙遠,但飛輪旋轉得非常快。所以這很令人興奮。有很多新東西需要構建。
即使基礎模型的進展現在停止了(但我認為不會停止),我們也會有五年的時間讓行業進行產品創新,基本上弄清楚如何最有效地利用迄今為止已經建成的所有東西。但實際上我認為基礎模型和基礎研究的進展正在加速。所以,這是一段相當瘋狂的時光。
您的愿景……正是您讓這一切成為了現實。
老黃:
在上次談話中,我……謝謝。我們是首席執行官,也是嬌嫩的花朵。是的,我們需要很多后衛。我們現在相當灰白了。我想我們是這個行業中最資深的兩位創始人,這是真的。
小扎:這是真的。你的頭發變白了,我的頭發卻變長了。
老黃:我的頭發變灰了,你的頭發變卷了。這是怎么回事?
小扎:它一直是卷曲的,這就是我把它剪短的原因。
老黃:是的,如果我知道要花這么長時間才能成功,我根本就不會開始。不,我會像你一樣輟學,搶占先機。
小扎:這就是我們性格之間的很大差異。我認為這些事情……
老黃:
你已經領先了12年。那非常好。你做得很好。
我喜歡你的愿景,即每個人都可以擁有人工智能,每個企業都可以擁有人工智能。在我們公司,我希望每個工程師和每個軟件開發人員都擁有一個人工智能,或者許多人工智能。我喜歡你的愿景,因為你也相信每個人、每家公司都應該能夠創造自己的人工智能。所以你們實際上已經開源了。當你開源Llama時,我認為這很棒。
順便說一下,Llama 2.1,我認為Llama 2可能是去年人工智能領域最大的事件。
小扎:原因是,我以為是H100,但它是……
老黃:這是一個先有雞還是先有蛋的問題。是啊,哪個先出現?
小扎:H100。Llama 2實際上并不是H100,是A100。
老黃:
是的,謝謝。
但我之所以說它是最大的事件,是因為當它出現時,它激活了每個公司、每個企業和每個行業。突然之間,每家醫療保健公司都在開發人工智能,每家公司都在開發人工智能,每家大公司、小公司、初創公司都在開發人工智能。這使得每個研究人員都能夠再次參與人工智能,因為他們有一個可以做某事的起點。
現在3.1已經發布,令人興奮的是,我們共同努力部署3.1。我們正在將其推廣至全球企業,興奮程度簡直無以言表。我認為它將支持各種應用。
但請告訴我您的開源理念。這是從哪里來的?而且你開源了PyTorch。現在它已經成為了人工智能實現的框架。現在您已經開源了Llama 3.1或Lama。圍繞它建立了整個生態系統。所以我認為這太可怕了,但這一切是從哪里來的呢?
小扎:
是的,這方面有很多歷史。我們長期以來已經做了很多開源工作。我認為部分原因在于,坦白地說,我們是在其他一些科技公司之后起步的,構建分布式計算基礎設施和數據中心之類的東西。正因為如此,當我們制造出這些東西的時候,它已經不具備競爭優勢了。我們想,好吧,我們不妨把它公開,然后我們將受益于周圍的生態系統。因此我們有很多這樣的項目。
我認為最大的一個可能是開放計算,我們將服務器設計、網絡設計以及最終的數據中心設計都發布在這里。通過將其打造成為某種行業標準,所有供應鏈基本上都圍繞它進行組織,這樣做的好處是每個人都能省錢。因此,通過將其公開,我們基本上已經節省了數十億美元的資金。Open Compute 也使得我們為一個數據中心設計的 NVIDIA HGX 突然可以在每個數據中心運行。
老黃:這是一次非常棒的經歷。
小扎:
我們已經使用一系列基礎設施工具完成了這項工作,比如 React、PyTorch。因此我想說,當 Llama 出現時,我們已經積極地傾向于這樣做了。具體來說,對于人工智能模型,我想我可以從幾個方面來看待這個問題。
一是,過去 20 年在公司里創造東西真的很有趣。最困難的事情之一就是我們必須通過競爭對手的移動平臺發布我們的應用程序。一方面,移動平臺給該行業帶來了巨大的福音,這真是太棒了。另一方面,必須通過競爭對手來交付產品,這很有挑戰性。在我成長的那個時代,Facebook 的第一個版本是在網絡上的,它是開放的。隨著向移動設備的過渡,好處是現在每個人的口袋里都有一臺電腦,這太棒了。缺點是,我們能做的事情受到了很大限制。
當你觀察這幾代計算技術時,就會發現存在著巨大的近因偏差,每個人都只關注移動設備,并認為,因為封閉的生態系統,因為蘋果基本上贏了,并設定了其條款。是的,我知道從技術上來說 Android 手機的數量更多,但蘋果基本上占據了整個市場并獲得了所有的利潤。基本上,Android 在開發方面是在追隨蘋果的。所以我認為蘋果顯然贏得了這一代產品。
但情況并不總是這樣。如果你回顧上一代,蘋果當時在做他們那種封閉的事情,但微軟,它顯然不是一個完全開放的公司,但與蘋果相比,Windows 在所有不同的 OEM 和不同的軟件上運行,不同的硬件,是一個更加開放的生態系統。Windows 是領先的生態系統。基本上,在 PC 時代,開放的生態系統贏得了勝利。我希望在下一代計算中,我們能夠回到開放生態系統獲勝并再次占據領先地位的區域。總是會有一個封閉的和一個開放的。我認為同時做這兩件事都是有理由的,兩者各有各的好處。在這一點上,我并不像一個狂熱分子。我們做的是閉源的東西,我們所發表的并不是所有的東西都是開放的。但我認為,總體而言,對于整個行業所構建的計算平臺而言,如果軟件是開放的,那么將具有很大的價值。這確實塑造了我的哲學觀念。
對于 Llama 的人工智能以及我們在 AR 和 VR 領域所做的工作,我們基本上是在開發用于混合現實的 Horizon OS,它是一種開放的操作系統,類似于 Android 或 Windows,基本上就是為了讓我們能夠與許多不同的硬件公司合作來制造各種不同的設備。我們基本上只是想讓生態系統恢復到開放的水平。我非常樂觀地認為,在下一代中,開放的將會獲勝。
對于我們來說,我只是想確保我們能夠獲得,這有點自私,但在建立了這家公司一段時間之后,我未來 10 年或 15 年的計劃之一就是確保我們能夠建立基礎技術,我們將在此基礎上構建社交體驗。因為我嘗試構建的東西太多了,然后被告知,不,你不能真正由平臺提供商在某種程度上構建這一點,我只是想,不,去他的。對于下一代,我們要一路走下去...
老黃:確保我們擁有廣播機會。嗶... (笑指小扎前面粗言)
小扎:抱歉。對不起。我們大概 20 分鐘內一切都還好,但是當我談論封閉的平臺時我就會生氣。
老黃:
嘿,看,很棒。我認為這是一個美好的世界,有人致力于構建最好的人工智能,不管他們如何構建它,并將其作為服務提供給世界。但是如果你想構建自己的人工智能,你仍然可以構建自己的人工智能。
所以能力——是的,完全是。要使用人工智能,有很多事情要做。我不想自己做這件夾克。我更希望有人為我量身定做這件夾克。你知道我在說什么?是的。是的。但皮革可以開源這一事實對我來說不是一個有用的概念。但我認為,如果你能擁有優質的服務、令人難以置信的服務以及開放的能力,那么我們基本上就擁有了整個范圍。
但是 3.1 的真正偉大之處在于您有 405B、70B、8B。您可以用它來生成合成數據,使用較大的模型來實質上教導較小的模型。盡管較大的模型會更加通用,更不易碎,但您仍然可以構建一個較小的模型,以適應您想要的任何操作領域或運營成本。
我想,你遇見了一名警衛。是的,Llamaguard。Llamaguard 用于護欄,太棒了。所以現在,您構建模型的方式是透明的。它有,你奉獻,你有一個世界一流的安全團隊,世界一流的道德團隊。您可以以這樣一種方式構建它,讓每個人都知道它已正確構建。所以我真的很喜歡它的這個部分。
小扎:
在我被 岔開話題之前,我確實認為存在這種一致性。我們構建它是因為我們希望這個東西存在,并將它從某個封閉的模型中剔除出去。但這不僅僅是一個可以構建的軟件,還需要一個圍繞它的生態系統。因此,如果我們不開源它,它幾乎就無法很好地運行。
我們這樣做并不是因為我們是利他主義者,盡管我認為這對生態系統是有幫助的。我們這樣做是因為我們認為通過在其周圍建立一個強大的生態系統,這將使我們正在構建的東西變得最好。看看有多少人為 PyTorch 生態系統做出了貢獻。
老黃:
是的,完全正確。大量的工程。僅 NVIDIA 一家,我們可能就有幾百人致力于讓 PyTorch 變得更好、更具可擴展性、性能更強等等。
小扎:
當某種東西成為行業標準時,其他人就會去解決它,因此,系統中的所有硅片最終都將得到優化,以便很好地運行這個系統,這將使每個人受益,但它也將與我們正在構建的系統配合良好。我認為,這只是其中一個例子,說明這種方法最終確實非常有效。所以,我認為開源策略將是一個很好的商業策略。我認為人們仍然不太明白這一點。
老黃:
我們非常喜歡它,并圍繞它建立了一個生態系統。我們建造了這個叫做 AI Foundry 的東西。
小扎:
你們在這方面做得非常棒。每次我們發布新產品時,你們總是第一個發布、優化并使其正常運行。所以,我很感激,但是我能說什么呢?我們有優秀的工程師。而且你們總是能很快地開始做這些事情。
老黃:
我是一名老年人,但我很敏捷。這就是首席執行官必須要做的事。
我認識到一件重要的事情。我認為 Llama 確實很重要。我們構建了這個概念,稱之為 AI Foundry,以便我們可以幫助每個人構建、采取行動。很多人都有構建人工智能的愿望。對他們來說,擁有人工智能非常重要,因為一旦他們將其放入飛輪、數據飛輪中,他們公司的機構知識就會被編碼并嵌入到人工智能中。所以,他們無法承受將人工智能飛輪、數據飛輪和經驗飛輪放在其他地方。因此,開源允許他們這樣做,但他們并不真正知道如何將整個東西變成人工智能。
因此,我們創建了所謂的“AI Foundry”。我們提供工具、提供專業知識、Llama 技術,我們有能力幫助他們將整個事情轉變為 AI 服務。然后,當我們完成這些之后,他們就拿走它,擁有它,它的輸出就是我們所說的 NIM。用戶只需下載 Neural Micro NVIDIA 推理微服務(NIM),并在任何他們喜歡的地方運行,包括本地環境。我們擁有一個完整的合作伙伴生態系統,從可以運行 NIM 的 OEM 到像埃森哲這樣的全球系統集成商(GSI)。我們對這些 GSI 進行了培訓并與其合作,以創建基于 Llama 的 NIM 和管道。現在,我們正在幫助世界各地的企業實現這一目標,這確實是一件令人興奮的事情。
這一切都是由 Llama 開源引發的。
小扎:
我認為,幫助人們從大模型中提取自己的模型的能力將成為真正有價值的新事物。就像我們在產品方面討論的那樣,我不認為會有一個主要的人工智能代理與每個人交談。它們處于同一水平,我認為不一定存在一個所有人都使用的模型。
老黃:
我們有芯片設計AI、軟件編碼AI。我們的軟件編碼AI能夠理解USD,因為我們使用USD來編碼全宇宙的東西。我們有一個可以理解Verilog的AI,即我們的Verilog。我們擁有能夠了解錯誤數據庫并知道如何幫助我們分類錯誤并將其發送給合適工程師的軟件AI。每一個AI都是根據Llama進行微調的,因此我們對它們進行微調和保護。如果我們有一個用于芯片設計的AI,我們就不會對詢問政治、宗教等問題感興趣,因此我們對其進行了防護。
我認為每家公司基本上都會為其每一項功能配備專門構建的AI,他們需要幫助才能做到這一點。
小扎:
未來的一個大問題是人們在多大程度上會使用更大、更復雜的模型,而不是僅僅為了他們的用途而訓練自己的模型。我敢打賭,它們將會是大量不同模型的混合體。
老黃:
我們使用最大的模型,因為我們的工程師的時間非常寶貴。我們現在獲得了針對性能進行了優化的405B。正如您所知,405B不適合任何GPU,無論多大。這就是為什么NVLink性能如此重要。我們的每個GPU都通過一個稱為NVLink交換機的非阻塞交換機連接。例如,在HVAC中有兩個這樣的交換機。我們讓所有這些GPU都能工作并運行405B,真正發揮作用。我們這樣做的原因是因為工程師的時間對我們來說非常寶貴。我們想使用最好的模型。事實上,它只節省了幾分錢,誰在乎呢?因此我們只是想確保向他們呈現最優質的結果。
小扎:
我認為405的推理成本大約是GPT-4o模型的一半。在那個水平上,它已經相當好了。但是,我認為人們正在設備上做一些事情,或者想要更小的模型。他們只是需要進一步提煉。
老黃:
這就像是一整套不同的服務。
假設我們正在雇用人工智能,用于芯片設計的人工智能每小時的費用大概是10美元。如果你在不斷使用它,并且與一群工程師共享該AI,那么每個工程師可能都有一個伴隨他們的AI,而且成本并不高。我們給工程師付了很多錢,所以,每小時幾美元可以放大某人的真正有價值的能力。
如果您還沒有雇用人工智能,請立即雇用。這就是我們要說的全部內容。那么,讓我們來討論下一波。
我非常喜歡你們所做的工作之一,計算機視覺。我們內部經常使用的模型之一就是對所有事物進行細分。我們現在正在視頻上訓練人工智能模型,以便能夠理解世界模型。我們的用例是用于機器人和工業數字化,并將這些AI模型連接到Omniverse,以便更好地建模和表示物理世界,讓機器人更好地在這些Omniverse世界中運行。
您的應用程序Ray-Ban Metaglass,以及將AI引入虛擬世界的愿景確實很有趣。請告訴我們更多。
小扎:
是的,里面有很多內容需要解開。您所談論的任意分段模型(Segment Anything2),我們實際上正在SIGGRAPH上展示它的下一個版本,任意分段二。現在它可以工作得更快,并且可以在視頻中發揮作用。我認為這些實際上是來自我考艾島牧場的牛,順便說一下,這些被稱為三月美味牛。
老黃:
下次我們再一起做,馬克會來我家,我們一起做費城奶酪牛排。下次你要帶著牛來。然后到了晚上結束時,你會想,嘿,你吃夠了,我當時想,我不知道,我還能再吃一個。通常當你說類似的話時,是為了保持禮貌。我當時就想,是的,我們會生產更多的奶酪。你吃飽了嗎?通常你的客人會說,哦是的,我很好。再給我做一份奶酪牛排,詹森。
只是為了讓你知道他有多么強迫癥,所以我轉過身,準備奶酪牛排。我說:“馬克,切西紅柿。”于是馬克,我遞給他一把刀。他把西紅柿切好,每一個都精確到毫米。真正有趣的是,我原本以為所有的西紅柿都會被切成片并堆放起來,有點像一副紙牌。但當我轉身時,他說他需要另一個盤子。原因在于他切開的所有西紅柿都沒有互相接觸。一旦他將一片西紅柿與另一片西紅柿分開,它們就不能再接觸。
他說,如果你想讓它們接觸,你就得告訴我。
這就是為什么我只是一名副廚師。這就是為什么他需要一個不會評判的人工智能。是的,這太酷了。它可以識別牛的蹤跡,正在識別并追蹤奶牛。
小扎:
用它可以實現很多有趣的效果,并且它還將為整個行業帶來許多更為嚴肅的應用。科學家利用這些技術來研究珊瑚礁、自然棲息地以及景觀的演變等。
能夠在視頻中做到這一點,并將其作為零鏡頭,并能夠與它進行交互并告訴它你想要跟蹤什么,這是非常酷的研究。
老黃:
舉個例子,我們使用它的原因是,你有一個倉庫,里面有一大堆攝像頭,倉庫人工智能正在監視正在發生的一切。假設一堆箱子掉了,或者有人把水灑在了地上,或者無論發生什么事故,人工智能都會識別出來,生成文本,發送給某人,然后就會有人提供幫助。這是一種使用方法。
如果發生事故,它不會記錄所有內容,也不會記錄視頻的每一納秒,然后回過頭來檢索那個時刻,它只會記錄重要的東西,因為它知道自己在看什么。因此,擁有一個視頻理解模型、一個視頻語言模型對于所有這些有趣的應用來說都非常強大。
現在,你們還準備做什么呢?雷朋眼鏡,跟我談談。
小扎:
是的,有很多智能眼鏡,所以我認為,當我們考慮下一個計算平臺時,我們會將其分解為混合現實、頭顯和智能眼鏡。而智能眼鏡,我認為人們更容易接受并佩戴它,因為幾乎每個今天戴眼鏡的人最終都會升級為智能眼鏡。這相當于世界上有十多億人。這將是一件大事。
VRM是頭顯。我認為有些人會發現它對于游戲或其他用途很有趣,有些還沒有。我的觀點是,它們將會同時存在于這個世界上。我認為智能眼鏡將會成為一種手機,一種下一代計算平臺的永遠在線版本。混合現實頭顯將更像你的工作站或游戲機,當你坐下來進行更身臨其境的體驗時,你會希望獲得更多的計算能力。眼鏡的外形非常小,這方面將會面臨很多限制,就像你不能在手機上進行相同級別的計算一樣。
老黃:
它恰好出現在生成式人工智能領域取得所有這些突破的時候。
小扎:
是的,所以基本上,對于智能眼鏡,我們從兩個不同的方向來解決這個問題。一方面,我們一直在開發我們認為理想的全息AR眼鏡所需的技術。我們正在進行所有定制硅片的工作、所有定制顯示堆棧的工作,以及使這些工作得以完成所需要做的所有事情。它們是眼鏡,但這不是頭顯。它不像 VR 或 MR 頭顯。它們看起來像眼鏡,但與您現在佩戴的眼鏡相比還有很大差距。它們非常薄,但即使是我們生產的雷朋眼鏡,也無法將全息 AR 所需的所有技術都融入其中。我們越來越接近了。在接下來的幾年里,我認為我們將會更加接近彼此。雖然它仍然會相當昂貴,但我認為它會開始成為一種產品。
我們從另一個角度來討論這個問題,先從好看的眼鏡開始。通過與世界上最好的眼鏡制造商 Essler Luxottica 合作,他們基本上擁有您使用的所有大品牌。無論是雷朋 (Ray-Ban)、奧克利 (Oakley) 還是奧利弗·皮帕斯 (Oliver Peoples),或者只是少數其他品牌,這有點像 Essler Luxottica 是眼鏡界的 NVIDIA。
老黃:我認為他們可能會喜歡這個比喻。
小扎:
誰不愿意呢?
我們一直在與他們合作研發雷朋 (Ray-Bans) 眼鏡。我們已進入第二代。我們的目標是將外形尺寸限制為看起來很棒的尺寸。在此范圍內,我們盡可能多地投入技術,同時明白我們無法從技術上達到理想效果,但最終,它會像很漂亮的眼鏡一樣。目前,我們已經有了攝像傳感器,所以你可以拍攝照片和視頻。您實際上可以將直播流傳輸到 Instagram。您可以在 WhatsApp 上進行視頻通話,并向對方直播您所看到的內容。它有麥克風和揚聲器,這個揚聲器確實非常好,是開放的耳朵設計,因此很多人覺得它比耳塞更舒適。您可以聽音樂,就像一種私人體驗一樣,這真是太棒了。人們喜歡這個,您可以用它接聽電話。
后來事實證明,這個傳感器包正是與人工智能對話所需要的東西,這算是一次意外。如果五年前你問我,我們是否會在人工智能之前獲得全息增強現實 (AR)?我會說,是的,可能吧。它看起來就像是所有虛擬和混合現實方面的圖形進展和顯示進展,并建立了新的顯示堆棧。我們正朝著這個目標不斷前進,這是正確的。隨后,這一突破在LLM學位課程上得以實現。事實證明,我們現在擁有非常高質量的人工智能,并且在全息增強現實出現之前,它的改進速度非常快。這是我真沒有想到的這種逆轉。
我們很幸運,因為我們致力于研發所有這些不同的產品。但我認為,最終你會得到一系列不同潛在眼鏡,不同價位的產品,以及不同技術水平的產品。因此,我認為,根據我們現在看到的雷朋 Metas 的情況,我猜售價 300 美元左右的無顯示屏 AI 眼鏡將成為一個真正受歡迎的產品,最終將有數千萬人或數億人擁有它。你將會擁有一個可以與你對話的超級互動人工智能。
老黃:
你剛剛展示了視覺語言理解,并且具備實時翻譯功能。你用一種語言和我說話,我聽到的卻是另一種語言。
小扎:
顯示屏顯然也會很棒,但它會增加眼鏡的重量,并且會使眼鏡變得更加昂貴。所以我認為會有很多人想要那種全息顯示屏,但也會有很多人希望最終能有像非常薄的眼鏡一樣的設備。
老黃:
對于工業應用和一些工作應用,我們需要它。我也認為對于消費品而言也是如此。你這么認為嗎?
小扎:
是的,我想,在 COVID 期間,當每個人都遠程辦公一段時間時,我就經常考慮這個問題。就好像你把所有的時間都花在了 Zoom 上。擁有這樣的技術真是太好了,但是在未來,我們大概要不了幾年就能舉行虛擬會議,就好像我并不是親自到場,這只是我的全息圖而已。感覺我們就在那里,親臨現場。我們可以一起做某事,一起合作做某事。
但我認為這對于人工智能來說尤其重要。對于該應用程序,我可以忍受不經常佩戴的設備。噢,是的,但我認為我們將會達到事實上的程度。是的,我可以。眼鏡有各種各樣的款式,有細鏡框的,也有粗鏡框的。但我認為我們距離擁有與你的眼鏡形狀相同的全息眼鏡還有一段時間。不過,我認為將它安裝在一副時尚的厚框眼鏡上也并不遙遠。如今,這些太陽鏡都適合小臉型。我看得出來。
老黃:
是的,這是一種非常有用的風格。無論是誰,就像我在努力成為一名時尚影響者,這樣我就能在這副眼鏡進入市場之前對其產生影響。
小扎:但我不知道。
老黃:
好吧,我看到你正在嘗試。你的風格對你的鍛煉有什么影響?
小扎:
現在還早,還早。
但我覺得如果未來業務的很大一部分是制造人們佩戴的時尚眼鏡,那么我應該開始更多地關注這一點。好的。是的,我們將不得不淘汰每天穿同樣衣服的我。但眼鏡也有同樣的問題。我認為它與手表或手機不同,人們真的不希望它們看起來都一樣。正確的。
所以我確實認為,這是一個適合的平臺,回到我們之前談到的主題,走向一個開放的生態系統,因為我認為人們對形式因素和風格要求的多樣性將是巨大的。并不是每個人都不想戴這種眼鏡,無論其他人設計什么,那都是不行的,我認為那樣不會成功。是的,我認為是對的。
老黃:
馬克,我們正處于一個整個計算堆棧被重新發明的時代,這真是令人難以置信。我們如何看待軟件,安德烈稱之為軟件一和軟件二,現在我們基本上處于軟件三。我們從通用計算方式到這些生成神經網絡處理的計算方式,我們現在可以開發的功能和應用程序在過去是不可想象的。生成式人工智能是一項能夠迅速影響消費者、企業、行業和科學的技術。我不記得還有哪項技術能如此快速地在各個領域產生如此深遠的影響。它不僅跨越了氣候技術、生物技術、物理科學等所有不同的科學領域,而且在我們所遇到的每一個領域中,生成式人工智能都處于根本性轉變的中心。
除此之外,正如您所談論的,生成式人工智能將對社會產生深遠的影響。我們正在生產的產品中,有一件讓我非常興奮的事情。之前有人問我,是否會有 Jensen AI?這正是您所說的創造性人工智能,我們可以構建自己的人工智能。我把我寫的所有內容都放到里面,并根據我回答問題的方式對其進行微調。希望隨著時間的推移和使用次數的積累,它會成為許多想要提問或交流想法的人的真正助手和伙伴。
正如您之前所說,這將是 Jensen 的版本,不會帶有任何評判性。你不怕受到評判,這樣你就可以隨時與它互動。我認為這些真是令人難以置信的事情。而且您知道,我們一直在寫很多東西。僅僅給出三到四個主題,這真是不可思議的事情。這些是我想要寫的基本主題,我用我的聲音來寫,只是以此作為起點。所以現在我們可以做的事情太多了。
和你一起工作真是太棒了。我知道創立一家公司并不容易。你們將業務從桌面轉向移動、VR、AI等所有這些設備。這真的、真的、真的很非凡。NVIDIA 自身也經歷了多次轉型。我非常清楚做到這一點有多么困難。而且這么多年來,我們倆都遭受過很多次打擊。但這正是成為先驅和創新的必需條件。看到你真是太好了。
(全場掌聲)
小扎:
同樣,如果你繼續做以前做的事情,不確定它是否是一個支點,但你也可以在其基礎上添加內容。這一切還有更多章節。我認為同樣的事情是,觀看你們所經歷的旅程很有趣。我們經歷了這樣一個時期,每個人都說,一切都將轉移到這些設備上,它將獲得超級便宜的計算。你們一直為此努力著。
老黃:
實際上,你會想要這些能夠癱瘓的大型系統。我們走了另一條路。我們不再制造越來越小的設備,而是制造倉庫大小的計算機。一時不時髦,有點不時髦,超級不時髦。但現在很酷。相反,我們開始構建圖形芯片,即 GPU。現在,當您部署 GPU 時,您仍將其稱為 Hopper H100。當扎克伯格稱其為 H100 時,他的 H100 數據中心數量會達到 600,000。而且他們是好顧客。
小扎:這就是您在 SIGGRAPH 上獲得 Jensen 問答的方式。
老黃:
哇。請稍等,我正在查看馬克·扎克伯格的問答。你是我的客人,我想確保馬克……
小扎:
有一天你打電話給我,說再過幾周我們將在 SIGGRAPH 上做這件事。那天我什么都沒做,我離開了丹佛,這聽起來很有趣。確切地說,那天下午我什么事也沒有做,你剛剛出現。
老黃:
這件事實在令人難以置信。你們構建的這些系統都是巨型系統,極難協調和運行。你說過你進入 GPU 領域比大多數人都晚,但你的運營規模卻比任何人都大,真是令人難以置信。祝賀你所做的一切。現在你已經成為時尚偶像了。看看這個家伙。
女士們、先生們,馬克·扎克伯格~ 謝謝。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.