99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI芯片的一百種死法

0
分享至


前幾天,英偉達成為首家市值達到2萬億美金的芯片公司,創(chuàng)造了歷史。同一時間,一家名為Groq的初創(chuàng)公司橫空出世,揚言“三年之內(nèi)趕超英偉達”。

Groq狠話的底氣,來源于它所開發(fā)的芯片——LPU。

LPU的全稱是Language Processing Unit,翻譯過來就是語言處理單元,是一種新型AI加速器。在它的支持下,大模型的推理速度快得驚人,瞬間能輸出長篇幅答案;而使用了英偉達芯片的GPT-4,只能一個字一個字往外蹦。

前者的響應(yīng)速度最高可達到500T/S,而后者只有40T/S[1]。

這是什么概念?相當于一秒鐘生成300個單詞,7分鐘生成一部《哈姆雷特》長度級的文章。


Groq背后的團隊也可謂群星璀璨,公司CEO Jonathan Ross是谷歌初代TPU的設(shè)計者之一。早期谷歌TPU團隊的10位成員中,8位都跳槽到了Groq。

自2016年成立,Groq就飽受市場關(guān)注。2020年,Groq的芯片被美國阿貢實驗室采用。2021年,Groq獲老虎環(huán)球基金等機構(gòu)投資,估值超過10億美元。

然而,Groq公司的各種“挑釁”,英偉達完全沒放在眼里。相比之下,此前“奧特曼7萬億美元造芯”的新聞出來之后,黃仁勛至少還出來說了兩句。

畢竟,眼下Groq的種種套路,老黃可再熟悉不過了。


文字游戲

當下,制約AI芯片發(fā)展的主要困境,是內(nèi)存墻:內(nèi)存的傳輸速度遠遠慢于處理器算力,導致性能遲遲上不去。

如果把芯片想象成一個餐廳,那么內(nèi)存就是倉庫,處理器就是后廚。

倉庫送菜比后廚烹飪還慢,嚴重限制了餐廳的出菜速度。因此,包括英偉達在內(nèi)的芯片廠商,都在圍繞“倉庫(內(nèi)存)”做文章。而Groq碾壓英偉達的秘訣,也藏在內(nèi)存結(jié)構(gòu)里。

傳統(tǒng)計算機所使用的內(nèi)存,其實有兩種:

DRAM容量較大,但傳輸速度較慢,起主存作用;而SRAM容量較小,但傳輸速度極快,作為緩存發(fā)揮輔助作用。一直以來,二者都是合作關(guān)系,缺一不可。

但Groq為了追求極致的速度,摒棄了DRAM,讓SRAM扛起了LPU主存大旗。

相當于砍掉距離廚房較遠的大倉庫,直接將所有食材都堆在廚房邊的菜籃子里。 這樣的設(shè)計思路下,LPU不但在速度上形成降維打擊,還輕松繞過了兩個成本最高的技術(shù): HBM和先進封裝。

這也構(gòu)成了Groq另一個大吹特吹的宣傳核心:便宜。

根據(jù)Semi Analysis的拆解,LPU由于具備架構(gòu)優(yōu)勢,物料成本僅為1050美元。相比之下,去年全球瘋狂的H100芯片,物料成本則達到3700美元[2]。

在售價層面,一塊LPU的價格是20000美元,遠低于H100的35000美元。


歷史無數(shù)次告訴我們,大部分彎道超車的結(jié)局都是有田下山,LPU也不例外。

大模型對內(nèi)存大小也有著很高的要求。參數(shù)量越大的模型,運行時所需要存儲的數(shù)據(jù)也會更多。

SRAM雖然快,但缺陷是容量小,通常只有4-16MB。Groq研發(fā)團隊多年苦心鉆研,最終也只是將LPU的容量提升至230MB。而一塊H100的內(nèi)存容量是80GB,兩者間差了約356倍。菜籃子再怎么升級換代,終究無法和倉庫相提并論。

想裝下所有的食材,唯一的辦法就是把菜籃子數(shù)量堆上去。因此,在運行同樣參數(shù)的模型時,需要用到的LPU數(shù)量就遠遠高于GPU。

前阿里技術(shù)副總裁賈揚清就算了一筆賬:


以運行LLaMA 70b模型為例,需要572張LPU,售價1144萬美元;但如果換成H100,其實只需要8張,總價格在30萬美元左右——所謂的“便宜”壓根不成立。

芯片一多,整體的功耗成本也直線上升。LPU每年至少消耗25.4萬美元電費,而H100頂多花費2.4萬美元。


事實證明,Groq的遙遙領(lǐng)先,只是隱去了核心信息的文字游戲。它所宣傳的“高速”,是以近乎夸張的使用成本換來的:運行三年LLaMA 70b模型,LPU的使用成本將比英偉達的GPU高出32倍。

當然,Groq的研發(fā)團隊,顯然對此心知肚明。選擇此時大張旗鼓,更像是一種拉投資的舉動。

事實上,這已經(jīng)不是Groq第一次公開“蹭熱度”了。

之前GPT Store剛發(fā)布時,Groq給OpenAI的奧特曼發(fā)了一封信,嘲笑使用GPTs跟在“深夜讀《戰(zhàn)爭與和平》一樣緩慢”。馬斯克的聊天機器人Grok發(fā)布時,它也跑去貼臉嘲諷,質(zhì)疑Grok抄襲了自己的名字。


過去幾年,打著“替代英偉達”旗號的初創(chuàng)公司數(shù)不勝數(shù),Groq只不過是其中之一。目前,在超車英偉達的這條彎道,已經(jīng)出現(xiàn)了嚴重塞車。

前車之鑒

Groq最直觀的參考樣本,來自英國公司Graphcore。

Graphcore誕生之初,也曾拿著“技術(shù)路線別出心裁、演示視頻酷炫驚艷、性能數(shù)據(jù)秒殺同行”的劇本,拳頭產(chǎn)品IPU與Groq的LPU設(shè)計思路異曲同工,也是用高速的SRAM取代DRAM作為芯片內(nèi)存,以實現(xiàn)極致的傳輸性能。

同時,Graphcore調(diào)整了芯片架構(gòu),專注于處理高性能計算。

它曾頗有自知之明地表示“不與英偉達直接競爭”,只將目標客戶定位在,特別需要大量高性能計算的化學材料和醫(yī)療等特殊領(lǐng)域。


Graphcore的兩位創(chuàng)始人

2019年,微軟成為Graphcore首款I(lǐng)PU的大客戶。 2020年5月,微軟科學家將IPU內(nèi)置于微軟Azure操作系統(tǒng)中,用于識別胸部X光片。 這位科學家說道:

“Graphcore芯片可以在30分鐘內(nèi)完成,GPU需要5個小時才能完成的工作。”

在最風光的2016至2020年間,Graphcore共拿到了7.1億美元融資,估值高達27.7億美元,一度被視為全英國乃至歐洲全村的希望。Graphcore的投資者不僅有微軟、三星、戴爾等科技巨頭,也囊括了紅杉資本、柏基投資等頂級風投。

相比今天的Groq,當年的Graphcore只能說有過之無不及。但Graphcore的后續(xù)發(fā)展卻遠遠不及當時的預期。

2022年,Graphcore全年營收只有270萬美元,為英偉達同期收入的萬分之一,且相較前一年下降46%,虧損達到了2億美元。 2023年,人工智能浪潮爆發(fā),英偉達業(yè)績再度暴漲。 H100一卡難求之時,Graphcore以為自己至少能撿到英偉達的漏,結(jié)果卻連湯都沒喝著。

去年,Graphcore的創(chuàng)始人Nigel Toon向英國首相寫了篇“公開信”,討要補貼。

他寫道,“Graphcore已經(jīng)為英國預留了多達3000個IPU芯片,可以為整個國家提供服務(wù)”,幾乎已經(jīng)是明示要錢[4]。


不久前,一面業(yè)績虧損,一面融資無果的Graphcore走向了最后一條路: 尋求收購。 根據(jù)The Telegraph爆料,其售價可能在5億多美元——不到2020年最高估值時期的五分之一[5]。

當年,以Graphcore為首的挑戰(zhàn)者們,各懷絕學,來勢洶洶,頗有一種八大門派圍攻光明頂?shù)募纫暩小H欢缃穸嘁焉⒆鼬B獸狀。

去年3月,芯片公司Mythic一度因資金耗盡而瀕臨倒閉,快要淹死之際,才好不容易等到了救命韁繩,拿到了1300萬美元融資。

另一家芯片公司Blaize也出現(xiàn)了類似的困境,最后靠著中東土豪的投資,才活了下來。

剩下的公司中,Habana可能是唯一活得不錯的——它被英特爾以20億收購,保留了獨立運營的權(quán)利。


從Graphcore到Mythic,這些芯片公司的技術(shù)路線各不相同;然而,它們失敗的原因,卻出奇一致。事實上,今天大火的Groq,同樣也極有可能倒在同一個地方:

芯片賣不出

真正的護城河

英偉達的GPU固然厲害,但它賣芯片的套路,才是真正的護城河。

每年,英偉達都會投入相當一部分的研發(fā)經(jīng)費,圍繞GPU搭建系統(tǒng)性能力。當然,這是高情商的說法,低情商的說法是開發(fā)一起“捆綁銷售”的產(chǎn)品——這才是英偉達最堅實的城墻。目前,英偉達的城墻共有3層:

第一層城墻,是CUDA的編程生態(tài)。

眾所周知,GPU最初的使用場景是游戲與視頻圖像渲染。早期,一些華爾街精英偶爾利用GPU的并行計算能力來跑交易,但由于需要重新編寫大量代碼,因此并未廣泛傳播開來。

黃仁勛堅信GPU能用于更多領(lǐng)域,因此在2006年推出了降低編程門檻的軟件架構(gòu)CUDA,和自家GPU捆綁推出。

后來,蘋果和AMD都推出了類似平臺,但此時CUDA生態(tài)早已構(gòu)建,在“用得人越多,CUDA越好用,新開發(fā)者越傾向于選擇CUDA”的良性循環(huán)中穩(wěn)定前進。

如今,CUDA可以讓英偉達GPU的使用成本大幅降低。

一位私有云CEO曾在接受采訪時說過,理論上AMD卡也不是不能用,但要把這些卡調(diào)試到正常運轉(zhuǎn),需要多耗費兩個月[6]——找誰下單,答案不言而喻。


2017年,英偉達甚至向AI研究員贈送了V100芯片

第二層城墻,是NV-Link的高速傳輸。

一個數(shù)據(jù)中心,不可能只使用一塊AI芯片。然而,如果將2塊AI芯片連在一起,那么實際算力必然會小于2,因為數(shù)據(jù)傳輸?shù)乃俣嚷谛酒懔Γ疫^程中還存在損耗。

顯然,在GPU數(shù)量迅速膨脹的數(shù)據(jù)中心內(nèi),解決數(shù)據(jù)傳輸問題其關(guān)鍵。

2016年,英偉達為IBM服務(wù)器提供GPU時,首次用上了自研的NVLink技術(shù),帶寬高達80G/s,通信速度提高了5倍,性能提升了14%,好評不斷。此后幾年,英偉達一邊迭代NVLink技術(shù),一邊規(guī)定該技術(shù)必須綁定自家芯片使用。

套路雖然簡單直白,但就是有效。

而第三層城墻,則是英偉達的“鐵桿好兄弟聯(lián)盟”。

過去一年,英偉達是全球最主要的人工智能投資人之一,活躍程度甚至超過了a16z和紅杉等頂級投資機構(gòu)。

據(jù)外媒統(tǒng)計,英偉達去年至少有35筆人工智能投資,包括:由前DeepMind聯(lián)合創(chuàng)始人創(chuàng)辦的Inflection AI,歐洲人工智能獨角獸Mistral,世界最大的開源模型社區(qū)Hugging Face等等[7]。


Inflection AI創(chuàng)始人蘇萊曼

積極投資的目的,其實很簡單:當黃仁勛提著美金和H100芯片,敲開這些公司的大門,沒有人會再拒絕英偉達。

這所有的一切,足以讓市面上絕大多數(shù)公司,都綁死在英偉達的船上。

面對性能強大的英偉達GPU,各路初創(chuàng)公司們或許有辦法,打造出性能相匹敵的產(chǎn)品。然而。英偉達賣芯片的套路,卻讓這些公司始終難以招架。因此,Graphcore等挑戰(zhàn)者的失敗,真的不是不努力。

當眼下的炒作逐漸回歸寂靜,Groq也得思考相同的問題:到底誰會翻過三座大山,來買LPU?

尾聲

2月23日,英偉達市值突破2萬億美元。距離上一個1萬億,僅僅過了9個月。

Groq的爆火,讓市場又一次開始討論同一個問題:到底有沒有人能叫板英偉達?

遺憾的是,英偉達遠比人們想象的要強大。人工智能浪潮給芯片行業(yè)提供了一塊大蛋糕,英偉達并沒有分的意思,而是整個端走塞進了口袋。

芯片初創(chuàng)公司Mythic的CEO曾憤然表示,人工智能火了,他們卻更難融資了,就是英偉達“搞壞了大環(huán)境”。

根據(jù)PitchBook數(shù)據(jù),截至2023年8月底,美國芯片初創(chuàng)企業(yè)融資8.814億美元,約為2022年同期的一半。交易數(shù)量的變化則更加觸目驚心:從23宗減少到了4宗[8]。

Graphcore、Mythic的前車之鑒歷歷在目,所以也不怪Groq跟大家玩兒文字游戲。面對這么一個“湯都不給喝”的龐然大物,Groq又能怎么辦呢?



參考資料

[1] Jay Scambler,X

[2] Groq Inference Tokenomics: Speed, But At What Cost,Semi Analysis

[3] 大模型最快推理芯片一夜易主:谷歌TPU創(chuàng)業(yè)團隊打造,量子位

[4] OPEN LETTER TO THE UK PRIME MINISTER ON INVESTMENT IN EXASCALE COMPUTE,Graphcore

[5] British AI champion explores foreign sale,The Telegraph

[6] Nvidia H100 GPUs: Supply and Demand,GPU Utils

[7] Nvidia emerges as leading investor in AI companies,F(xiàn)T

[8] Nvidia's dominance in AI chips deters funding for startups,reuters

封面圖片來自 shotdeck

編輯:陳彬

視覺設(shè)計:疏睿

責任編輯:陳彬


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
1784年,52歲的華盛頓牙齒掉光了,便從他的奴隸口中拔了9顆牙齒

1784年,52歲的華盛頓牙齒掉光了,便從他的奴隸口中拔了9顆牙齒

南權(quán)先生
2025-05-31 18:11:29
梁洛施現(xiàn)身北京潭柘寺禮佛,在寺廟吃素面!普通話講得非常好!

梁洛施現(xiàn)身北京潭柘寺禮佛,在寺廟吃素面!普通話講得非常好!

西瓜愛娛娛
2025-05-30 09:11:26
塞爾維亞竟成為烏克蘭最大彈藥供應(yīng)國!俄軍損失四千坦克

塞爾維亞竟成為烏克蘭最大彈藥供應(yīng)國!俄軍損失四千坦克

項鵬飛
2025-05-30 21:32:24
父親臨終塞我銀行卡,叮囑我避開老公,5年后我翻出藏錢暗格淚崩

父親臨終塞我銀行卡,叮囑我避開老公,5年后我翻出藏錢暗格淚崩

今天說故事
2025-05-16 18:55:06
正式簽約,張本智和發(fā)聲,官宣決定,跳槽原因曝光

正式簽約,張本智和發(fā)聲,官宣決定,跳槽原因曝光

懂球社
2025-05-10 09:41:32
老師前排打傘后續(xù):當事人被多方談話刪掉原視頻,同類事件引爭議

老師前排打傘后續(xù):當事人被多方談話刪掉原視頻,同類事件引爭議

石辰搞笑日常
2025-06-01 12:41:12
卡洛斯:國家德比有次防梅西手指骨折,我說是梅西的錯他說對不起

卡洛斯:國家德比有次防梅西手指骨折,我說是梅西的錯他說對不起

直播吧
2025-06-01 13:45:12
安東尼深情告別貝蒂斯:這是人生最美麗篇章,這份愛此生不渝

安東尼深情告別貝蒂斯:這是人生最美麗篇章,這份愛此生不渝

直播吧
2025-06-01 00:42:32
風清揚為何會獨孤九劍?金庸:把他的名字倒過來讀,真相水落石出

風清揚為何會獨孤九劍?金庸:把他的名字倒過來讀,真相水落石出

金寶哥講故事
2025-06-01 15:45:04
天呢!網(wǎng)傳最大的鐵飯碗要破裂,直接影響200萬人生計…

天呢!網(wǎng)傳最大的鐵飯碗要破裂,直接影響200萬人生計…

慧翔百科
2025-05-21 14:02:24
把兒子養(yǎng)廢后我才明白:最坑人的建議,就是勸你“無條件”尊重娃

把兒子養(yǎng)廢后我才明白:最坑人的建議,就是勸你“無條件”尊重娃

棉花糖媽媽
2025-05-31 21:32:43
以軍襲擊加沙援助物資分發(fā)點 致22死百余傷

以軍襲擊加沙援助物資分發(fā)點 致22死百余傷

財聯(lián)社
2025-06-01 12:15:39
川普怒了,節(jié)后A股要承壓?

川普怒了,節(jié)后A股要承壓?

我是概念愛好者
2025-06-01 08:24:51
八國聯(lián)軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

八國聯(lián)軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

娛樂喵喵說
2025-06-01 12:42:52
上海一保姆隱藏身份工作13年,業(yè)主發(fā)現(xiàn)她真正身份后,從30樓跳下去

上海一保姆隱藏身份工作13年,業(yè)主發(fā)現(xiàn)她真正身份后,從30樓跳下去

故事秘棧
2025-05-26 19:16:38
隨處可見的花蚊子,來中國僅50年,為何會令人“聞風喪膽”?

隨處可見的花蚊子,來中國僅50年,為何會令人“聞風喪膽”?

心中的麥田
2025-05-30 16:16:19
0-5!歐冠決賽史上最大的慘敗是怎樣誕生的

0-5!歐冠決賽史上最大的慘敗是怎樣誕生的

體育世界
2025-06-01 15:43:41
戀情實錘?曝孫穎莎王楚欽裝修新房?獎杯照曝光,誰注意隊友表態(tài)

戀情實錘?曝孫穎莎王楚欽裝修新房?獎杯照曝光,誰注意隊友表態(tài)

東球弟
2025-06-01 11:10:48
退休老頭凌晨從30層一躍而下,存款320萬,卻留遺言:活著太難

退休老頭凌晨從30層一躍而下,存款320萬,卻留遺言:活著太難

黑貓故事所
2025-05-31 06:05:07
晚上8點!CCTV5直播,鄭欽文拒絕爆冷,預測2-0

晚上8點!CCTV5直播,鄭欽文拒絕爆冷,預測2-0

體育就你秀
2025-06-01 09:22:16
2025-06-01 16:32:49
遠川科技評論 incentive-icons
遠川科技評論
用投資視角,扒巨頭秘史
346文章數(shù) 2263關(guān)注度
往期回顧 全部

科技要聞

特朗普突然炒掉NASA準局長,嫌他不"忠誠"?

頭條要聞

中國臨床試驗反超 美媒焦慮:藥也都要中國制造了

頭條要聞

中國臨床試驗反超 美媒焦慮:藥也都要中國制造了

體育要聞

一邊倒的歐冠決賽,青春無敵的新科冠軍

娛樂要聞

張若昀夫婦國外遛娃 男方推平價兒童車

財經(jīng)要聞

油價繼續(xù)下跌?歐佩克宣布將再度增產(chǎn)

汽車要聞

零跑汽車5月交付量達45,067臺 穩(wěn)居新勢力前三

態(tài)度原創(chuàng)

教育
房產(chǎn)
親子
公開課
軍事航空

教育要聞

二年級競賽題,思維拓展,有難度嗎?

房產(chǎn)要聞

金地華南落子海南自貿(mào)港22萬㎡標桿項目,夯實代建行業(yè)領(lǐng)軍者地位

親子要聞

“兒童迷你廚房”可動火插電,“真煮真吃”背后的安全隱患

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長在香會大肆渲染中國威脅 中方回應(yīng)

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 青海省| 册亨县| 肇庆市| 普洱| 广南县| 樟树市| 航空| 西林县| 鞍山市| 资中县| 阿拉善右旗| 临西县| 都昌县| 镇巴县| 阳江市| 精河县| 巴彦县| 桑植县| 乌什县| 双城市| 文成县| 泸州市| 和田市| 卓资县| 惠安县| 获嘉县| 年辖:市辖区| 高陵县| 邮箱| 鄂尔多斯市| 竹山县| 柳州市| 若尔盖县| 曲沃县| 富锦市| 浦城县| 冀州市| 乌兰察布市| 榆社县| 旅游| 三原县|