國產AI大模型DeepSeek R2最近放了個大招,推理成本直接砍到GPT-4的3%,技術指標還碾壓國際巨頭。
它背后的昇騰芯片、算力基建、應用場景全鏈條都是“中國制造”,一批A股公司已經抱上大腿,訂單拿到手軟。
一、技術底牌:成本暴降,國產算力殺瘋了
DeepSeek R2用上了華為昇騰910B芯片集群,單集群算力干到512 PetaFLOPS,相當于同時啟動50萬臺頂配游戲電腦。
它訓練模型時動態激活的參數只有780億,但總參數規模達到1.2萬億,相當于用1/15的功耗干出了GPT-4同級別的效果。
這套技術直接把推理成本壓到每token 0.07美元,比GPT-4便宜了97%。 現在用它跑一次工業質檢,電費成本比請工人喝杯奶茶還低。
二、躺賺名單:這些公司已經上車
1. 投資方的“原始股福利”
浙江東方旗下的基金三年前就押注了DeepSeek天使輪,相當于在茅臺鎮還沒火的時候囤了地皮。 華金資本去年跟投了Pre-A輪,現在光是手里那點股權,估值已經翻了20倍。
最騷的操作是每日互動,它家子公司不僅持有DeepSeek母公司14.5%的股份,還專門給大模型投喂用戶行為數據。 相當于既當股東又當供應商,兩頭吃紅利。
2. 華為昇騰的“親兒子們”
立昂技術承包了DeepSeek超算中心一半的基建訂單,四川簡陽的AI算力園區已經開始試運行,光是機柜租金一年就能收3個億。 拓維信息更狠,它代工的昇騰服務器直接塞進了超算中心,單臺機器報價比市場價高出15%,但甲方還得排隊等貨。
亞康股份吃下了昇騰算力的獨家運維生意,全國80%的昇騰服務器調試都得找他們。 最近剛中標北京人工智能公共算力平臺項目,合同金額直接沖著9位數去了。
3. 悶聲發財的“賣鏟人”
中科曙光的液冷服務器火了,單個機柜功率飆到40千瓦,相當于把20臺電磁爐懟進鐵箱子里跑。 現在全國在建的12個智算中心,有9個點名要他們家設備。
仕佳光子的光芯片被數據中心搶瘋了,800G光模塊產能全開還是不夠用。 蘇州工廠三班倒生產,工人春節都沒放假,老板已經準備在科創板再融一輪。
4. 落地場景的“技術變現王”
隆基股份的光伏板質檢車間,DeepSeek R2把誤檢率壓到了百萬分之七。 按他們年產能100GW計算,一年能省下2.6億次人工復檢,光是這招就夠競爭對手追三年。
美格智能正在把模型塞進智能手表里,測試機已經能實時監測20種心律異常。 最近剛和華為運動健康簽了聯合開發協議,下半年就要量產。
三、產業鏈暗戰:華為生態VS英偉達幫
華為昇騰現在手握三張王牌:立昂技術搞基建、拓維信息做硬件、亞康股份管運維,從土建到螺絲釘全包圓了。
對比之下,英偉達陣營的浪潮信息還在等H20芯片放貨,中際旭創的1.6T光模塊量產至少還要等半年。
最戲劇性的是中科曙光,它家液冷服務器既能適配昇騰也能兼容英偉達,最近剛給北京某智算中心交付了“混血”機柜,上層跑華為芯片訓練政務模型,下層用A100處理圖像識別。
四、數據爭奪戰:誰在給AI喂飯?
每日互動手里握著4.5億移動設備的行為數據,專門給DeepSeek投喂用戶點擊、停留、滑動信息。 這些數據訓練出來的推薦模型,已經在某電商平臺把轉化率提升了37%。
云賽智聯拿下15個省級政務云項目,把DeepSeek模型接進了醫保審核、信訪處理系統。 光是在江蘇試點,就自動攔截了8000多起騙保案件,人工審核量直接砍掉一半。
五、芯片突圍:國產替代的明牌
中芯國際的14nm昇騰910B芯片良率爬到了68%,比半年前提升了11個百分點。 現在華為每季度砸20億囤貨,中芯的北京新廠房提前三個月封頂。
寒武紀的思元590芯片蹭上了順風車,雖然性能只有昇騰的80%,但價格便宜三分之一。
某東部省份的智算中心招標時,硬是要求30%的算力必須用國產芯片,這單子直接進了寒武紀口袋。
六、冷門玩家:邊緣端的黑馬
夢網科技把DeepSeek模型接進了國際短信平臺,自動生成的外貿話術模板,讓跨境電商的回復率從3%暴漲到19%。 去年Q4靠這個功能,海外業務收入翻了1.4倍。
東方國信用DeepSeek給鋼廠做智能配礦,把鐵水成分波動控制在±0.03%。 寶武集團試用三個月后,噸鋼成本降了11塊,今年要推廣到所有分廠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.