算法、算力、數據是AI發展的三駕馬車。當開源的算法和公開的數據都不再神秘時,算力的擴張就成為AI競爭的必由之路。
當ChatGPT掀起全球AI競賽時,硅谷巨頭們曾斷言“算力即權力”,認為千億參數模型必須依賴海量GPU的堆砌,大模型的訓練動輒就萬卡集群,英偉達的H100芯片被炒至4.5萬美元的天價。然而,DeepSeek以行業十分之一的訓練成本打造的MoE模型,卻在多個基準測試中超越眾多主流AI模型。這場華麗的技術革命,不僅挑戰了“算力至上”的神話,更揭示了AI競爭底層邏輯的根本性轉變——從資源消耗的“暴力計算”轉向算法創新的“效率覺醒”。
谷歌用5400億參數的PaLM模型來證明“規模至上”,Meta用數萬億token訓練Llama,以及OpenAI用上億美元訓練GPT-4的豪賭,讓全球陷入“參數競賽”的狂熱。DeepSeek的突圍暴露了傳統路徑的致命缺陷:當業界沉迷于堆砌算力時,算法的邊際收益已漸漸接近天花板。DeepSeek采用的專家混合架構(MoE)通過稀疏激活機制,使模型參數利用率提升5倍,配合知識蒸餾技術將推理能耗降低80%。這場效率革命的背后,正是模型架構、動態計算和數據煉金術三大技術支點的協同突破,算法創新的“杠桿效應”開始顯現。
效率創新使算力依賴大幅度降低,這對于以GPU來安家立命的英偉達來說卻是一場災難,高算力的GPU需求面臨斷崖式下滑。而算力需求的變化又將反映到電力和能源領域,并有望打破電力困局。
在DeepSeek橫空出世之前,算力的競爭同時也將走向電力的競爭。根據估算,全球數據中心年耗電量已超過伊朗全國用電量,訓練GPT-4產生的碳排放相當于3000輛汽車的年排放量。當科技巨頭們競相囤積GPU時,馬斯克就曾警告“AI將吞噬全球電力”。算力擴張不僅面臨著芯片漏電和量子隧穿效應的物理極限,也帶來了散熱成本的極大支出,這直接使得頭部AI公司訓練成本增速和模型商業變現效率倒掛,迫使企業從“堆算力”轉向“摳能效”。這一轉變預示著行業價值鏈條的重構,那些在架構創新與能源革命交叉點布局的企業,將主導下一個智能時代,AI競爭進入算法、能源、生態三維協同的新紀元,在智能密度、認知深度、場景滲透率方面鋪開競技場,未來的AI競爭將呈現綠色智能、微觀智能、生物啟發計算等特征,甚至可能突破馮·諾依曼體系的瓶頸,引發第二次AI革命。
需要指出的是,算力利用效率的提高,并不代表著算力消耗的必然降低。相反,它會使原來用不起大量高端GPU的企業,可以低成本地部署中低端算力,從而在整體上增加算力需求。其原理就是杰文斯悖論:在技術進步提高資源利用效率后,資源總消耗量反而可能增加,而非減少。這在19世紀工業革命時期就已經過檢驗:在瓦特改良蒸汽機后,煤炭效率提升,這在很大程度上節省了煤炭,但工業規模擴大又導致煤炭總需求激增。算法創新提升的算力效率,不一定會降低AI未來的算力要求,但一定會重塑AI的競爭格局。
最后,引用一下DeepSeek的自言自語:“DeepSeek的突圍不是特例,而是效率覺醒時代的先聲。”當全球AI競賽從“暴力美學”轉向“精致藝術”,算法紅利開始對沖算力通脹,決定勝負的將不再是計算資源的簡單堆砌,而是對智能本質的深刻理解與優雅解構。這場靜悄悄的革命,終將把人類帶向更可持續的智能文明。
本文作者:
邱元陽
河南省安陽縣職業中專
文章刊登于《中國信息技術教育》2025年第07期
引用請注明參考文獻:
邱元陽.算力的競爭:從暴力計算到效率覺醒[J].中國信息技術教育,2025(07):14.
歡迎訂閱
識別上方二維碼即可訂閱
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.