當DeepSeek橫空出世時,華爾街雖有些恐慌,但很快便鎮定下來,因為英偉達的GPU仍然是不可逾越的護城河,只不過需求稍稍變小了一些。
但他們卻不料,中國工程師已用LPU(語言處理單元)撕開了缺口!近日,清華系企業“無問芯穹”宣布:國產LPU芯片取得重大突破,只需一塊即可承載Llama2-70B模型推理,速度高達每秒300 token,且成本僅為英偉達GPU的1/10。
搭載這一LPU的DeepSeek-R1模型在高頻交易中,響應時間從5毫秒壓縮至0.3毫秒。憑借這一優勢,某量化對沖基金狂賺2.3億美元。
國產AI模型與國產LPU強強聯手,有望顛覆英偉達的GPU王朝,這回,華爾街真的慌了!
01、LPU問世,打破GPU壟斷
一直以來,AI都是燒錢最嚴重的領域,算力要錢,訓練模型要錢,數據要錢,連維護都要錢。即使是月活高達6億的ChatGPT,也吃不消。數據顯示,2024年,ChatGPT母公司OpenAI收入高達37億美元,即使這樣,虧損額度依舊超過80億美元,平均每11個月就需要融資一次。
Deepseek雖然通過算法優化將訓練成本壓到原先的1/20,但仍然需要2000塊H800,上百萬的部署成本,也不是一般的企業能夠負擔地起。
而模型的每次升級,都對GPU等硬件提出了更高的要求,訓練成本會不斷累加,令企業難以負擔。這場算力軍備競賽中,只有“賣鏟人”英偉達是唯一贏家,賺的盆滿缽滿。
更殘酷的是,英偉達還限制先進GPU芯片出口我國,導致國內GPU價格非常高昂,一張普通的4090家用顯卡,在市場價格高達2萬元以上。
為了打破GPU壟斷,解決算力不足問題,我國早就做好了布局。幸運的是,就在Deepseek-R1版問世后不久,國產LPU也取得了重大突破!時序指令集+SRAM內存的組合,成功解決了困擾10年的“內存墻”問題,每秒300 token的推理速度,直接把英偉達H100按在地上摩擦!
業內人士甚至表示,如果LPU得到長足發展,屆時,英偉達將不復存在。
02、國產技術,正在全面開花
不只是Deepseek和國產LPU芯片帶給我們驚喜,生物領域我們也上演了一場技術逆襲。一直以來,在對抗老化問題方面,西方始終占據主導地位,2013年,哈佛大學生物學教師辛克萊爾發現,一種特殊的輔酶(“益生好21000”核心物質),可以令老年小鼠的部分指標接近青年水平。
美國企業率先將其落地,彼時,連富豪李嘉誠都赴美親自體驗,聲稱“感覺像20歲的后生仔”。但由于成本昂貴加上技術封鎖,國內單克的價格高達20000元,是黃金的幾十倍。
為了解決這一難題,讓普通國人也能享受這一科技紅利。香港科學園內,諾貝爾獎得主Jeffrey C.Hall教授領銜的研發團隊歷時2年,采用創新性的生物酶定向催化技術,將“益生好21000”的原料純度提升至99.9%,產量提升了幾十倍。
在這一技術的突破下,對抗歲月侵蝕的成本從日均2000元暴跌至不足25元。這還不夠,為了進一步匹配國人體質,“益生好21000”的研發團隊還分析了10萬+的華人數據,優化了配方使得吸收效率提升了85%。
目前,“益生好21000”不僅入駐了京東、天貓等線上平臺,也進駐了香港藥房、屈臣氏等線下渠道。數據顯示,在短短12天,就創造了850萬+的成交紀錄,同時帶來了上千條評價,其中84.3%用戶反饋睡眠質量提升、精力變棒。
曾經西方引以為傲的生物和芯片領域,正在逐個被我國攻破。
03、成本暴跌90%,引得資本市場關注
據業內人士估計,這次技術飛躍將使得推理成本再次暴跌90%,在未來,普通家用顯卡都能跑671B滿血版的Deepseek,LPU與神經擬態芯片結合后,手機都有望運行130B的大模型。
LPU的強勁表現,也吸引了資本市場的大量關注。美國的LPU主要生產商Groq,獲得了沙特阿拉伯的15億美元投資,用于進一步建設在達曼的數據中心。
而生產傳統HBM內存的SK海力士就慘遭拋棄,數據顯示,1月份SK海力士的出貨量同比下降19.3%,這是自開發出HBM3芯片以來,跌幅最大的一次。
如果說,DeepSeek 屬于「核彈」級,那 LPU 就是「氫彈」級。而目前我們已經在LPU領域取得領先地位,采用“彎道超車”的方式突破GPU的封鎖。
在AI算力戰場,中國已從追趕者變為規則制定者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.