公眾號記得加星標(biāo)??,第一時間看推送不會錯過。
來源:內(nèi)容編譯自semiengineering。
人類正在經(jīng)歷一場極其極端的技術(shù)革命,其規(guī)模之大可能超出人類智力所能及的范圍。生成式人工智能 (GenAI) 的性能每六個月翻一番,甚至超越摩爾定律,業(yè)界稱之為“超摩爾定律”。一些云端人工智能芯片制造商預(yù)計,未來十年內(nèi),其性能每年都將翻一番或三倍。在這個由三部分組成的博客系列中,我們將探討當(dāng)今半導(dǎo)體行業(yè)的格局和芯片制造商的創(chuàng)新戰(zhàn)略,在第二部分深入探討未來面臨的重大挑戰(zhàn),并在第三部分總結(jié)推動人工智能未來發(fā)展的新興變革和技術(shù)。
專家預(yù)測,以這種爆炸式的速度,通用人工智能 (AGI) 將在 2030 年左右實現(xiàn) ,隨后不久,超級人工智能 (ASI) 也將出現(xiàn)。AGI 將擁有類似人類的推理能力,而 ASI 將超越人類,能夠進(jìn)行自我編程,甚至超越最專業(yè)的大腦所能理解的范圍。AGI 通過自我改造快速進(jìn)化為 ASI 的過程,通常被稱為智能爆炸。
下圖展現(xiàn)了這種指數(shù)級加速發(fā)展,令人難以忽視。短短幾年間,人工智能在許多曾被認(rèn)為需要深厚專業(yè)知識的復(fù)雜任務(wù)上超越了人類。此外,它還在迅速逼近其他領(lǐng)域,例如推理、數(shù)學(xué)問題解決和代碼生成。數(shù)十年來停滯不前的能力,如今在數(shù)月內(nèi)便實現(xiàn)了飛躍。如果這種速度持續(xù)下去,人工智能將很快在幾乎所有認(rèn)知領(lǐng)域超越人類,使通用人工智能 (AGI) 從理論變?yōu)楝F(xiàn)實。
比較人工智能與人類在不同領(lǐng)域的能力。當(dāng)人工智能的表現(xiàn)跨越零分線時,其得分將高于人類
這種快速發(fā)展對半導(dǎo)體行業(yè)的影響是深遠(yuǎn)的,因為 GenAI 正在推動對用于訓(xùn)練和推理的先進(jìn)云端 SoC 的強勁需求。分析師預(yù)測,到 2030 年,這一專業(yè)領(lǐng)域的規(guī)模將接近 3000 億美元,復(fù)合年增長率接近 33% 。
這種激增的需求正在 打破人們 對半導(dǎo)體市場變化速度的舊有假設(shè),GenAI 的快速發(fā)展證明它們可以在一夜之間顛覆半導(dǎo)體市場。圖表顯示,生成式人工智能在兩年內(nèi)就達(dá)到了個人電腦近十年才達(dá)到的普及水平,甚至比智能手機、平板電腦 [8] 和互聯(lián)網(wǎng)的發(fā)展速度還要快。
生成式人工智能的采用超過了早期 PC 和互聯(lián)網(wǎng)的使用,39.4% 的 18-64 歲美國人報告稱在 ChatGPT(生成式預(yù)訓(xùn)練 Transformer)發(fā)布后的兩年內(nèi)使用了生成式人工智能,這使其成為歷史上增長最快的技術(shù)
地緣政治進(jìn)一步放大了這些市場震蕩。中美科技競爭已將半導(dǎo)體變成了兩個超級大國軍備競賽中的一項戰(zhàn)略資產(chǎn)。美國實施了廣泛的出口限制,阻止中國獲得美國人工智能處理器,旨在減緩其邁向通用人工智能 (AGI) 的進(jìn)程 [11]。中國正采取顛覆性舉措予以反擊,例如開源 DeepSeek-R1。由于美國的芯片限制,這款芯片是使用上一代芯片制造的。
芯片制造商為實現(xiàn)產(chǎn)量最大化而采取的多種策略
下表匯總了幾款領(lǐng)先 AI 芯片的最新規(guī)格。所有數(shù)據(jù)均基于單芯片,而非多芯片系統(tǒng)(例如 NVIDIA 的 GB200 NVL4)。表中僅包含發(fā)布時可用的芯片。
這些數(shù)據(jù)提供的是高層次的概述,而非嚴(yán)格的同類比較,后者需要在相同的工作負(fù)載和條件下測試所有芯片。每瓦性能 (PPW) 是通過計算 (PFLOPS?1000)/瓦 (PFLOPS·1000)/瓦推導(dǎo)出來的,但一些芯片制造商并未公開披露瓦數(shù)(見下文“不適用”)。
該表格的編制主要依據(jù)官方供應(yīng)商規(guī)格和信譽良好的第三方來源。少數(shù)情況下,數(shù)值是推斷出來的,例如基于 8 位浮點 (FP8) 每秒千萬億次浮點運算 (PFLOPS) 估算 16 位浮點 (FP16) 性能。
市場上一些最受歡迎的云 AI 加速器的鳥瞰圖。*片上 SRAM,與其他使用片外 HBM 的芯片不同。
將所有供應(yīng)商進(jìn)行這樣的比較,可以揭示出 AI 加速器設(shè)計中的多種策略:
NVIDIA 和 AMD 憑借基于 GPU 的架構(gòu)和海量 HBM 內(nèi)存帶寬占據(jù)主導(dǎo)地位。
AWS、Google 和 Microsoft 依賴針對其數(shù)據(jù)中心優(yōu)化的定制硅片。
Cerebras 和 Groq 致力于推動晶圓級芯片和數(shù)據(jù)流執(zhí)行等創(chuàng)新架構(gòu)。例如,Cerebras 的單芯片運算速度高達(dá) 125 PFLOPS,帶寬高達(dá) 21 PB/s。而 Groq 則強調(diào)超低延遲數(shù)據(jù)流路徑,以降低推理延遲。
生成式人工智能的加速發(fā)展軌跡不僅改變了技術(shù),也重塑了半導(dǎo)體行業(yè),加劇了地緣政治緊張局勢。隨著芯片制造商競相提供前所未有的處理能力和效率,他們部署的策略多種多樣且富有創(chuàng)新性,但挑戰(zhàn)也同樣嚴(yán)峻。這種快速發(fā)展也伴隨著巨大的障礙,尤其對于基于云端的人工智能部署而言,有效且可持續(xù)地擴展變得越來越復(fù)雜。
https://semiengineering.com/genais-breakneck-pace-is-reshaping-the-semiconductor-industry/
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4091期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.