作者/質子
編輯/嘉嘉
日前,因涉嫌市場壟斷,英偉達被國家市場監督管理總局立案調查。受此影響,英偉達、AMD、阿斯麥等美股半導體公司股價應聲而下,其中在被立案調查當日,英偉達股價下跌近3%,市值蒸發掉6400億元。
與海外半導體公司普遍下跌相比,中國AI半導體概念股集體上漲,寒武紀盤中漲超3%,海光信息漲超4%,景嘉微漲超5%……
作為AI加速芯片沙皇,英偉達掌握著全球90%的市場份額,H100、A100更是被全球AI公司跪求,在AI產業發展的關鍵期,對英偉達立案調查是否會影響中國AI大模型的發展?
其實完全不用擔心,雖然在性能上,中國AI芯片企業跟英偉達還有較大差距,但在產業鏈生態上,中國AI企業已經度過了筑基期,正在加速發展。
【1】Open AI將英偉達送上王座
2022年11月30日,Open AI發布全新聊天機器人模型ChatGPT,產品上線五天,全球用戶量就突破100萬,宣告了AI技術取得重大突破。
這一天對黃仁勛來說,是英偉達的“iPhone時刻”——此后全球成立的AI企業數量近3萬家,其中僅生成式AI,國內企業數量就高達4500 家,這些企業對算力、AI芯片有著極強的渴求度。
據了解,2018年,Open AI發布GPT-1時,模型擁有的參數為1.17億個,但到了2023年發布GPT-4時,其模型參數達到了1.8萬億個,五年時間參數量增幅超過一萬倍。
更為重要的是,算力需求還在持續增長。華為預測數據顯示,在2020年的算力基礎上,2030年AI的算力要求將增長500倍,通用算力要求將增長10倍。
“數據結構發生變化,現在都是大量的非結構數據,都是圖片、視頻、語音,CPU處理能力很弱的數據”,在接受第一財經采訪時,華為昇騰計算業務總裁張迪煊表示,海量的非結構性數據需要更高的算力支撐,這就需要英偉達的GPU。
與專注一件事的CPU不同,英偉達GPU專為并行計算而設計,它本來適用于對圖形進行渲染,能同時處理數千個計算線程,極大提升了大模型的訓練速度。
英偉達GPU在AI訓練速度上有多強悍?看一組數據對比就知道了,以GPT-3基準測試為例,英特爾系統訓練耗時67分鐘,而英偉達系統只需要3.4分鐘,英偉達在效率上完勝英特爾。
靠著AI算力需求的浪潮,英偉達達到了歷史巔峰。天眼查數據顯示:2023年,英偉達營收為609 億美元,凈利潤更是達到297.6億美,市值更是達到3.36萬億美元。
而要知道,在十年前,英偉達還是那個全年營收41億,要給雷軍站臺才能拉來訂單的IT邊緣廠商。
(來源:百度股市通)
生成式AI將英偉達送上了王座,但在大國角逐的舞臺上,即便強如英偉達,依然受到波及。
【2】中國AI被打壓
“中國的現狀是一流的應用、二流的模型、三流的算力”,中金公司研究部計算機行業首席分析師于鐘海在談及中國AI產業發展時認為,算力是最為薄弱的環節,也是國內AI企業最重要的環節。
但想要國產替代談何容易。
國內AI加速芯片最能打的型號是華為昇騰910B,該芯片采用采用7nm工藝,擁有496億個晶體管,其FP16的運算性能約為320Tflops,整體性能達到英偉達A100的水平。
而英偉達目前最先進的AI芯片為GB200,該芯片采用4nm工藝,擁有2080億個晶體管。
目前國內普遍認為:“H100性能是A100的2至3倍,Blackwell B200是H100的5倍”,我們可以換算出,一顆英偉達GB200相當于10—15顆昇騰910B。
可以說英偉達要性能有性能,要生態有生態,要性價比有性價比,在這種綜合能力打擊下,英偉達壟斷了國內90%的AI加速芯片,華為等AI芯片只能做點邊緣業務。
(來源:英偉達)
歷史是驚人的巧合,與光刻機、手機芯片等半導體產業一樣,中國AI加速芯片轉折點源于一次又一次的封鎖和打壓。
2022年9月,美國政府通過設置功率門檻和芯片之間通信速度門檻,限制英偉達A100 和 H100以及 AMD MI250對華出口。為了能向中國市場供貨,英偉達根據限制條件,為中國研發出了“閹割”版本的A800和H800芯片。
2023年10月,為了進一步限制中國AI產業,美國升級限制力度,要求英偉達禁止向中國市場出售運行速度達到300 teraflops(即每秒可計算 3億次運算)及以上的數據中心芯片。
這也意味著,此前“閹割”版的A800和H800也被禁止出售中國,為此,英偉達不得不再次“閹割”,推出HGX H20、L20 PCle、L2 PCle三款AI加速芯片。
據了解,“閹割”版在“閹割”后的HGX H20芯片,價格為11萬一顆,但整體計算能力只有H100的15%,L20 PCle和L2 PCl其FP16稠密算力分別為8.8TFLOPS和4.4TFLOPS,只有H100的12%、6%。
這樣的性能根本不能滿足國內AI大模型廠商的算力需求。
確實,誰都知道AI是未來,是方向,但出口已經被美國封死壓制,沒有一點出路,留下的只有反抗。
【3】走過筑基期
正如《三體》中水滴對地球科技發展的鎖死一樣,美國政府對英偉達一而再,再而三的不斷施壓,中國AI企業從英偉達等國外廠商進口的AI加速芯片的通道已經被鎖死。
“美國在AI芯片領域對中國的制裁長期不會取消,而中國半導體制造工藝由于也受美國制裁,將在相當長時間處于落后狀態”,在華為全聯接大會2024上,華為副董事長、輪值董事長徐直軍直接挑明,“這就意味著我們所能制造的芯片的先進性將受到制約。這是我們打造算力解決方案必須面對的挑戰。”
科技有國界,形勢異常艱巨,核心基礎技術卡脖子意味著將生存的命脈放在對方手中,中國AI企業必須放棄幻想,準備戰斗,然而反抗的火種已經在各個產業悄然打響。
12月2日,美國商務部宣布了新的對華半導體出口管制措施,將140家中國企業列入實體清單。次日,中國互聯網協會、中國汽車工業協會、中國半導體行業協會以及中國通信企業協會集體發表聲明:美國相關芯片產品不再安全、不再可靠,建議國內企業謹慎采購美國芯片。
顯然現在國內像華為、百度等AI加速芯片在性能上無法替代英偉達的高端芯片,但中國AI加速芯片已經初見成效,形成產業集群。
華為推出昇騰910B,寒武紀推出910B AI芯片,其FP16稠密算力達到128TFLOPS,超過英偉達A100;海光信息推出的海光2000 AI芯片,是國內首款基于5nm工藝的云端推理芯片;百度昆侖與飛槳及其他國產軟硬件組合打造了國產化AI技術生態……
更為重要的是,在國產供給的同時,因為不滿英偉達“閹割版”的“閹割版”的AI芯片性能,中國移動、百度等企業開始采購國內AI芯片。
2023年8月,百度以4.5億元的價格向華為采購1600顆昇騰910BAI芯片;今年年初,字節跳動更是向華為采購10萬顆昇騰910BAI芯片;2024年4月,中國移動智算中心(呼和浩特)投產使用,部署2萬張AI加速卡,其中AI芯片國產化率為85%。但到了8月底,中國移動智算中心(哈爾濱)投入使用時,AI芯片國產化率100%。
外采變內購,在美國行政命令的限制下,英偉達只能向中國提供性能被大幅“閹割”的AI芯片,根本無法滿足國內市場需求,但正是因為政策限制,反而推動了國產AI加速芯片研發生產。
曾經相似被卡脖子的困境我們也曾遇到,2019年,因為美國貿易制裁和限制,華為無法獲得7nm芯片,其消費電子業務被直接按下剎車鍵,華為一度從即將超越蘋果成為全球第一大手機廠商,跌落到邊緣手機廠商,但隨著MATE60、三折疊屏手機的問世,華為內磐重生。
如今類似的境遇也發生在百度等AI大模型廠商身上,英偉達的大模型訓練工具被斷供,但好消息是,面對美國的不斷封鎖,中國AI加速芯片已經走過了筑基期,剩下的只需要耐心和等待。
2019年,對于中國制造光刻機,ASML首席執行官溫彼得一臉傲慢:就算給你們全套圖紙,中國也造不出光刻機。但四年后,面對同樣的問題,溫彼得頗為憂傷:中國有14億人,而且聰明人很多,我們太自以為是了。
我們真心希望,光刻機、手機芯片發生的事情,四年后能AI加速芯片身上上演,這一定很難,但一定會實現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.