99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達的反擊:挾H100以令諸侯

0
分享至

  

  論騷操作,硅谷恐怕沒有CEO能比得上黃仁勛。

  去年,黃仁勛向微軟、谷歌和亞馬遜這些云計算廠商提出了一個計劃:這些廠商都有很多搭載了英偉達GPU的服務器,由英偉達租用這些服務器,然后讓英偉達的工程師對其進行“優(yōu)化”,再以英偉達的名義租給普通的AI企業(yè),從中賺取差價。

  說簡單點,以前微軟會直接把云服務賣給中小公司,現(xiàn)在由英偉達進來當中間商。當然按照英偉達官方的說法,此舉是為了“向云計算廠商展示在數(shù)據(jù)中心配置GPU的正確方法”[1]。

  服務器還是那個服務器,但經(jīng)過英偉達“優(yōu)化”后,客戶就從微軟優(yōu)化到英偉達了。但就是這樣一個匪夷所思的提議,除了亞馬遜之外,各大云計算廠商居然都同意了。

  2023年3月,英偉達正式上線云計算服務DGX Cloud。事實證明,經(jīng)過英偉達工程師的優(yōu)化后,DGX Cloud在訓練大模型時表現(xiàn)得的確更好;在此基礎上,英偉達還破例允許短期租賃。僅僅半年時間,英偉達就拿下了軟件公司ServiceNow等大客戶。

  科技公司愿意配合英偉達騷操作的真實原因,可能還是因為英偉達手中握有大模型時代最稀缺的資源——H100。

  當下,幾乎所有的企業(yè)都沒有足夠的算力。連OpenAI創(chuàng)始人阿爾特曼,都曾在一次聽證會上無奈地表示:“如果人們減少使用ChatGPT,我們會非常高興,因為我們的GPU非常短缺[2]。”

  買了多少H100,甚至可以成為決定AI成就的關鍵因素。這也讓英偉達有了“挾H100以令諸侯”的底氣。

  計算機的“稀土”

  通常來說,科技企業(yè)會通過購買云計算廠商的服務,來滿足算力需求。從2023年3月開始,微軟Azure、亞馬遜AWS等云計算廠商也先后上架了HGX H100的租賃服務,HGX H100是由4個或8個H100組成的服務器。

  然而,當下供需嚴重失衡,云計算廠商這點H100存貨已經(jīng)遠遠滿足不了市場的胃口。2023年H1的財報中,微軟專門更新了一條風險因素:如果無法獲得足夠多的AI芯片,云計算業(yè)務可能會中斷。

  許多初創(chuàng)公司需要排隊等待3-12個月,一旦友商搶在自己前面,那可能就是幾十上百億估值的損失。

  

   HGX H100

  無數(shù)“H100窮人”們,只能被迫發(fā)揮主觀能動性,看誰的路子更野。

  面對《紐約時報》的采訪,一位創(chuàng)業(yè)者將H100比作“稀土”。早些時候,他跑去請求美國國家科學基金會投資自己,僅僅因為基金會底下一個項目剛好有少數(shù)空置的H100。

  在硅谷,AI創(chuàng)業(yè)者打招呼的方式,都變成了“我認識一個有H100的家伙”——不知道的還以為在買賣毒品[4]。

  GPU Utils曾測算過H100搶購潮背后具體的需求數(shù)據(jù):

  對需要自己訓練大模型、追求大力出奇跡的企業(yè)來說,沒有個上萬塊H100都不好意思出門。由前DeepMind聯(lián)合創(chuàng)始人蘇萊曼創(chuàng)辦的Inflection AI,成立方才一年,已買了2.2萬個H100;至于Meta這樣財大氣粗的公司,很可能會購買10萬個甚至更多。

  對微軟Azure等云計算廠商來說,每一家也都需要至少3萬個H100。而其余幾家私有云,還將消耗總計約10萬個H100。

  測算后發(fā)現(xiàn),僅美國大型科技公司和少數(shù)幾家明星初創(chuàng)公司,需求量已達到約43萬個[5]。如果再算上其他初創(chuàng)企業(yè)、研究機構(gòu)、大學,乃至富裕國家的追逐、再加之黃牛、黑市等不可控因素,實際需求很可能遠大于這個數(shù)字。然而據(jù)英國《金融時報》爆料,今年H100的出貨量大約是55萬個[6]。

  H100之所以令人如饑似渴,其中一個核心原因在于其近乎壟斷的市場地位。

  面對大模型訓練對極致效率的需求,H100在大多數(shù)情況下都是最優(yōu)解。

  MPT-30B是第一個使用H100訓練的開源LLM(大語言模型),實際訓練只耗費了11.6天;相比之下,使用前一代的A100訓練則需要28.3天[7]。如若換成參數(shù)規(guī)模更龐大的AI,例如1800B的GPT-4,效率差異會更加明顯。跑馬圈地的時代,時間就是一切。

  除此之外,H100在模型推理上的效率也遠高于A100。盡管H100的首發(fā)價約為3.3萬美元,如今二手市場價格更上漲至4-5萬美元;但若將H100和A100的性能分別除以各自的價格,能發(fā)現(xiàn)H100的性價比實際也高于A100。

  

  

   MPT-30B的具體訓練、推理情況

  黃仁勛說,“Buy more GPUs , the more money you save(買得多,省得多)”,似乎不無道理。

  也正因為如此,即便美國限制了H/A100的對華出口,國內(nèi)科技公司仍在搶購閹割版的H/A800——盡管閹割版的芯片間數(shù)據(jù)傳輸速度只有前者一半,意味著需要在大模型訓練上花費更多時間。

  除需求量龐大之外,造成H100短缺的另一個原因是產(chǎn)能的嚴重不足。

  H100芯片需要使用SK海力士的HBM內(nèi)存,以及臺積電的CoWoS封裝——兩者都因過于昂貴,此前并沒能大規(guī)模市場化,預備產(chǎn)能并不多。由于產(chǎn)能爬坡尚需時間,有分析師預測H100的短缺至少會持續(xù)至明年一季度,也有人認為要到明年年底才有可能有所緩解[9]。

  

   H100內(nèi)部結(jié)構(gòu)

  H100的空前盛況,讓黃仁勛在短短一年時間內(nèi)體驗了一回坐過山車的感覺。

  去年二季度,消費市場萎靡不振加上挖礦企業(yè)扎堆倒閉,英偉達交出了一份不及格的財報,“GPU滯銷,幫幫我們”的表情包一度遍地都是。一年之后,黃仁勛成功向資本市場展示了什么叫“反向暴雷”,同比營收暴漲854%,大幅超出了最樂觀分析師的預測。

  巔峰換來了漫天的吹捧,但黃仁勛心里清楚,英偉達的頭上一直懸著一把劍。

  不可避免的戰(zhàn)爭

  今年8月,傳奇工程師吉姆·凱勒對媒體評論道,“我不認為GPU是運行AI的全部,世界憎惡壟斷[11]。”

  此番發(fā)言雖有給自家AI芯片打廣告之嫌,卻也是業(yè)界的共識。

  事實上,那些購買了最多H100的大型科技公司,基本都不太“安分”:微軟、谷歌、Meta,或多或少都嘗試過自研AI芯片。

  這讓英偉達面臨著一個異常尷尬的處境:在AI芯片領域,自己與“大客戶”之間,未來幾乎必有一戰(zhàn)。

  大型科技公司們選擇自研AI芯片,最初都源于一個非常質(zhì)樸的需求——省錢,其中最典型的便是谷歌。

  早在2014年,谷歌已啟動了自研芯片計劃。彼時,OpenAI的首席科學家伊利亞還在谷歌工作,打造出了一套頗具顛覆性的AI模型。該模型脫胎于伊利亞的“大力出奇跡”理念,只需要灌入足夠多且正確的數(shù)據(jù),它便能更好地完成翻譯、語音識別等工作。然而待到實際應用時,谷歌卻犯了難:

  如果將AI服務安裝至10億多臺安卓手機中,哪怕每個人每天只使用3分鐘,谷歌都需要2倍于當前數(shù)據(jù)中心的算力。當時谷歌已經(jīng)建了15個數(shù)據(jù)中心,每個造價上億美金,“超級加倍”顯然不切實際。

  最終,谷歌自研出了性能更強、功耗更低的TPU,大大提升了單個數(shù)據(jù)中心的算力供應,以一種更經(jīng)濟實惠的方式解決了算力難題。

  

   引入了TPU的數(shù)據(jù)中心

  TPU的出現(xiàn),令黃仁勛如坐針氈,開始了“爆改GPU”,很快在性能上實現(xiàn)了反超,其最新成果便是H100。不過,H100的售價實在過于昂貴。

  如果按重量售賣H100,那么其每盎司售價將達到黃金的一半;即便對地球上最賺錢的科技公司而言,這筆“英偉達稅”也堪稱天文數(shù)字。

  然而,H100的實際制造成本并不高。據(jù)金融咨詢公司Raymond James測算,H100的成本約為3320美金,僅占首發(fā)價的1/10,黃仁勛含淚賺10倍[12]。

  自研芯片的經(jīng)濟收益毋庸置疑,但除此之外其實還有另一個好處:垂直整合打造差異化。

  堆疊算力不是簡單的往車里加汽油,需要考慮軟件適配性、自身業(yè)務需求等一系列問題。例如AI所使用的深度學習框架有多個派別,谷歌是TensorFlow,Meta用的PyTorch,而百度則有PaddlePaddle,硬件需要根據(jù)不同框架做適配。

  專門定制的AI芯片,可以更加緊貼自身AI業(yè)務的需求。所以Meta在今年又重啟了自研芯片計劃,針對PyTorch框架定制了全新的MTIA芯片。

  對大公司來說,考量芯片的核心其實不是算力,而是“單位美元提供的算力”,也就是成本。谷歌的TPU和特斯拉的Dojo都證明了,定制服務的成本是可以接受的。

  眼下,“反抗的星火”已經(jīng)點燃。據(jù)外媒爆料,大型科技公司的云計算團隊,已開始頻繁勸說客戶改用其自研芯片,而不是英偉達的GPU。英偉達固然是目前為止絕對的贏家,但沒人知道平衡什么時候會被打破。

  不過,面對這場不可避免的戰(zhàn)爭,英偉達也留了后手。

  挾H100以令諸侯

  英偉達打出的第一張牌,叫CoreWeave。

  CoreWeave成立于2017年,最初是一家以太坊挖礦公司,后來轉(zhuǎn)型做起了云計算業(yè)務。據(jù)CoreWeave創(chuàng)始人透露,2022年公司收入為3000萬美金,僅有微軟Azure的1/1133,在硅谷幾乎沒什么存在感。

  然而到了2023年,CoreWeave突然一夜成名,接連簽下Inflection AI和Stability AI兩個大客戶,年營收預計將達到5億美金,一年翻16倍。除此之外,微軟甚至決定在未來幾年花費數(shù)十億美金購買其服務;其中僅2024年的訂單,已有20億美金。

  改變CoreWeave命運的貴人,正是英偉達。

  今年4月,英偉達參與了對CoreWeave的投資;但比起美元,英偉達還給了它一項更稀有的資源——H100。CoreWeave是全球第一家上線HGX H100租賃服務的云計算企業(yè),比微軟Azure還要早一個月。

  

   CoreWeave三位創(chuàng)始人

  這番安排,其實是黃仁勛的有意為之。

  H100近乎壟斷的市場地位加之嚴重短缺的現(xiàn)狀,讓英偉達手中多了一層權力:他可以自由決定優(yōu)先供貨的對象。

  相比自己跟Big Tech們同床異夢的塑料友誼,CoreWeave和英偉達是實打?qū)嵉母锩鼞?zhàn)友。因此,英偉達削減了對大型科技公司的H100供應,轉(zhuǎn)而將這部分產(chǎn)能交給了CoreWeave等“自家兄弟”——它們曾確保不會自研芯片。

  從結(jié)果來看,這一戰(zhàn)略不僅避免了囤積現(xiàn)象的出現(xiàn),也確實搶到了大型科技公司的蛋糕:

  例如前文提到的Stability AI,在2022年底時一直將亞馬遜AWS視作唯一云服務商;然而到了今年3月,困于算力不足的Stability AI,悄悄叩開了CoreWeave的大門。

  事實上,英偉達手中并非僅有CoreWeave一張牌。這位手握H100的投資人,還投資了同為云計算公司的Lambda Labs,以及三家從事大模型、應用開發(fā)的明星初創(chuàng)企業(yè)。

  

   前DeepMind聯(lián)合創(chuàng)始人蘇萊曼創(chuàng)辦的Inflection AI,也接受了英偉達的投資

  在畝產(chǎn)十萬大模型的當下,H100是比美元還珍貴的硬通貨,也為英偉達創(chuàng)造了一個寶貴的窗口期:盡可能讓更多公司用上H100,趁早建立起生態(tài),“把朋友搞得多多的”。

  那么這個窗口期能持續(xù)多久呢?

  尾聲

  英偉達的一系列“騷操作”已經(jīng)引來了美國反壟斷機構(gòu)的注意,同時,全球瘋搶H100的現(xiàn)狀,很可能不會長期持續(xù)下去。

  正如前文所述,H100產(chǎn)能受限是因為臺積電和SK海力士的預備產(chǎn)能不足;隨著新產(chǎn)線陸續(xù)落地,短缺狀況會逐漸得到緩解。

  除此之外,旺盛的需求也未必會延續(xù)下去。

  事實上,越來越多的科技公司和研究機構(gòu)都選擇將大模型開源。隨著市場上的優(yōu)質(zhì)開源模型越來越多,初創(chuàng)企業(yè)和研究機構(gòu)可以不必再自己動手訓練,轉(zhuǎn)而直接下載開源模型,根據(jù)自身業(yè)務需求進行開發(fā)或者推理。

  Meta發(fā)布開源大模型Llama后,斯坦福、卡內(nèi)基梅隆等多所高校的研究人員就曾聯(lián)合起來,以此為基礎打造了開源大模型Vicuna,很快便突破了200萬次下載。

  

   Vicuna

  在肉眼可見的未來,算力的主要使用場景很可能會從訓練轉(zhuǎn)向推理——屆時,H100便不再是獨孤求敗了。因為不同于追求極致效率的訓練場景,AI推理其實更看重性價比。

  另一方面,以大模型為代表的生成式AI如今面臨的問題在于:面對高昂的算力成本,除了英偉達,大家都還沒賺到錢。

  2006年CUDA平臺推出時,英偉達以超脫于行業(yè)的前瞻性推動了AI的飛速進步。而如今,英偉達氣勢如虹的業(yè)績似乎也是一種拷問:它是不是已經(jīng)從AI的推動者,變成了AI前進的阻力?

  

  參考資料

   [1] Nvidia Muscles Into Cloud Services, Rankling AWS,The Information

   [2] OpenAI CEO Sam Altman testifies at Senate artificial intelligence hearing | full video,CBS News

   [3] Google Gemini Eats The World – Gemini Smashes GPT-4 By 5X, The GPU-Poors,Semi Analysis

   [4] The Desperate Hunt for the A.I. Boom’s Most Indispensable Prize,The New York Times

   [5] Nvidia H100 GPUs: Supply and Demand,GPU Utils

   [6] Saudi Arabia and UAE race to buy Nvidia chips to power AI ambitions,F(xiàn)inancial Times

   [7] MPT-30B: Raising the bar for open-source foundation models

   [8] China’s internet giants order $5bn of Nvidia chips to power AI ambitions,F(xiàn)inancial Times

   [9] AI Capacity Constraints - CoWoS and HBM Supply Chain,Semi Analysis

   [10] Insight: Inside Meta's scramble to catch up on AI,Reuters

   [11] Jim keller發(fā)聲:世界憎恨壟斷,GPU不是全部,半導體行業(yè)觀察

   [12] Nvidia Makes Nearly 1,000% Profit on H100 GPUs: Report,Toms Hardware

   [13] 深度學習革命,凱德·梅茨

   [14] 英偉達帝國的一道裂縫,飯統(tǒng)戴老板

   [15] CoreWeave came ‘out of nowhere.’ Now it’s poised to make billions off AI with its GPU cloud,Venture Beat

   [16] Why Nvidia Aids Cloud Rivals of AWS, Google and Microsoft,The Information

   [17] TPUv5e: The New Benchmark in Cost-Efficient Inference and Training for <200B Parameter Models,Semi Analysis

   [18] Nvidia’s Hot Streak May Not Last Forever,The Information

   編輯:李墨天

   視覺設計:疏睿

   責任編輯:陳彬

   研究支持:何律衡

  

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
大型修羅場!日本一小哥帶女友去吃飯,結(jié)果餐廳里坐滿了前女友

大型修羅場!日本一小哥帶女友去吃飯,結(jié)果餐廳里坐滿了前女友

手工制作阿殲
2025-07-19 09:15:28
好一個圍魏救趙!宗家的遺產(chǎn)內(nèi)幕,你們都吃錯了瓜,真重點在這里

好一個圍魏救趙!宗家的遺產(chǎn)內(nèi)幕,你們都吃錯了瓜,真重點在這里

美美談情感
2025-07-18 21:13:41
雞蛋漲完牛肉漲,后面番茄也要漲!關稅就這樣“砸”了美國人餐桌

雞蛋漲完牛肉漲,后面番茄也要漲!關稅就這樣“砸”了美國人餐桌

上觀新聞
2025-07-19 16:25:28
14歲少女騎行遭瘋狂別車,仗義出手的外賣員找到了

14歲少女騎行遭瘋狂別車,仗義出手的外賣員找到了

極目新聞
2025-07-19 15:24:43
葉珂復播了,自曝產(chǎn)女后與黃曉明徹底分手,沒給黃曉明留一絲體面

葉珂復播了,自曝產(chǎn)女后與黃曉明徹底分手,沒給黃曉明留一絲體面

娛樂看阿敞
2025-07-19 08:51:36
獲賠88萬律師拿走55萬后續(xù):憑本事拿的并沒錯,本人回應律協(xié)發(fā)聲

獲賠88萬律師拿走55萬后續(xù):憑本事拿的并沒錯,本人回應律協(xié)發(fā)聲

大魚簡科
2025-07-18 21:22:34
取消車檢呼聲強烈!交通部出新規(guī),車主:太爽了,終于等到這一天

取消車檢呼聲強烈!交通部出新規(guī),車主:太爽了,終于等到這一天

阿傖說事
2025-07-18 10:15:02
女子在一私立醫(yī)院就醫(yī)赤裸上半身時,遭護士闖入,當事人:醫(yī)院曾提出賠償68元沒接受,護士被扣工資、通報批評

女子在一私立醫(yī)院就醫(yī)赤裸上半身時,遭護士闖入,當事人:醫(yī)院曾提出賠償68元沒接受,護士被扣工資、通報批評

魯中晨報
2025-07-19 07:32:06
知名裝飾連鎖品牌靚家居被曝倒閉

知名裝飾連鎖品牌靚家居被曝倒閉

新快報新聞
2025-07-18 23:32:10
極端高溫致河南室內(nèi)大量蚊子被熱死

極端高溫致河南室內(nèi)大量蚊子被熱死

魯中晨報
2025-07-18 09:16:05
阻礙救護車后續(xù)!暴走團大媽發(fā)聲:你靠邊停停吧,我們一百多人呢

阻礙救護車后續(xù)!暴走團大媽發(fā)聲:你靠邊停停吧,我們一百多人呢

說說史事
2025-07-19 12:06:22
司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

古希臘掌管松餅的神
2025-07-19 08:57:51
娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

老爵爺沉思錄
2025-07-18 22:25:04
總理去世,毛遠新問:誰當總理合適?毛主席說:還是他比較好一些

總理去世,毛遠新問:誰當總理合適?毛主席說:還是他比較好一些

冰雅憶史
2025-07-19 10:38:01
73年歷史的星級酒店擺攤賣鹵味 記者實探:1小時賣斷貨,大廚刀功切出花

73年歷史的星級酒店擺攤賣鹵味 記者實探:1小時賣斷貨,大廚刀功切出花

封面新聞
2025-07-18 19:40:09
我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結(jié)果曝光

我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結(jié)果曝光

鋭娛之樂
2025-07-19 01:55:03
臺風黃色預警持續(xù),“韋帕”或于明天登陸粵瓊一帶沿海

臺風黃色預警持續(xù),“韋帕”或于明天登陸粵瓊一帶沿海

界面新聞
2025-07-19 16:37:19
71歲成龍四川買房!一直盯著裝修蒼老許多,兒子卻還像個大學生

71歲成龍四川買房!一直盯著裝修蒼老許多,兒子卻還像個大學生

木子愛娛樂大號
2025-07-19 10:48:33
街上沒人,商場沒人,工廠沒人,就連農(nóng)村也沒人?人都上哪去了?

街上沒人,商場沒人,工廠沒人,就連農(nóng)村也沒人?人都上哪去了?

小談食刻美食
2025-07-18 21:26:14
宗慶后為何愛睡女下屬

宗慶后為何愛睡女下屬

不正確
2025-07-18 17:58:01
2025-07-19 18:07:00
遠川科技評論 incentive-icons
遠川科技評論
用投資視角,扒巨頭秘史
353文章數(shù) 2270關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內(nèi)職務

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內(nèi)職務

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂要聞

肖戰(zhàn)微博改名:去掉X玖少年團頭銜

財經(jīng)要聞

娃哈哈爭產(chǎn)大戰(zhàn):杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發(fā)布"汽車行車控制安全技術驗證VCTA"

態(tài)度原創(chuàng)

時尚
教育
本地
親子
手機

造城者“她”,用設計重塑城市溫度

教育要聞

震驚!北大竟然在江蘇都沒招滿?還有0人投檔

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調(diào)色盤?

親子要聞

什么是自閉癥訓練中的有效指令.mp4

手機要聞

OPPO K13 Turbo 系列手機參數(shù)匯總,7 月 21 日發(fā)布

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 德昌县| 随州市| 拜城县| 浮山县| 武邑县| 陇西县| 安顺市| 山东省| 涞源县| 亚东县| 余庆县| 汉阴县| 东光县| 厦门市| 东方市| 石景山区| 贺兰县| 南康市| 平顺县| 修文县| 兴和县| 县级市| 化德县| 阳春市| 兴业县| 班玛县| 富裕县| 通山县| 荔浦县| 于田县| 尉氏县| 剑河县| 江口县| 东乌| 台南市| 大名县| 准格尔旗| 公安县| 昌平区| 拜城县| 河北区|