“AI時代,Tokens成為新的衡量標準,2024年年初,中國日均Token消耗量為1千億,今天每日消耗量已達到了十萬億級,1年增長100倍。”華為昇騰計算業務總裁張迪煊,在昇騰人工智能伙伴峰會上這樣說。
華為昇騰計算業務總裁張迪煊作《與時代 共昇騰》演講
龐大Token消耗量背后,反應的是當下中國正在進入一個“AI應用的黃金期”。不過,大模型落地并非一蹴而就的。再聰明的大模型也僅是“缸中之腦”,想要引發山呼海嘯的AI變革浪潮,仍需要有人為其提供大量的配套支持。
種種跡象表明,2025年正在成為AI應用元年。但誰又在為千行萬業智能化轉型按下加速鍵呢?
將DeepSeek“搬”出實驗室
DeepSeek絕對會在中國AI發展史上,留下濃墨重彩的一筆。其DeepSeek性能優越,被一些美國人稱為“人工智能的斯普特尼克時刻”,認為它的威力不亞于冷戰期間蘇聯發射首顆人造衛星“斯普特尼克1號”,對美國產生的沖擊。
盡管DeepSeek“聰明絕頂”,但在發布之初其距離“人人使用”的“國民大模型”仍有較大距離。原因有二:
一是,DeepSeek的滿血版模型(V3和R1)參數高達6710億,單機部署需多塊高性能GPU比如需要8卡并行才能部署,而國產AI芯片在多機互聯技術尚未完全突破,導致滿血版模型在端側部署困難;
二是,DeepSeek專注于文本生成與推理,本身缺乏多模態能力,在醫療影像診斷、工業質檢中適配性受限。
這些問題得不到解決,DeepSeek便只是個聰明一點的“Chat Bot”。中國企業則又會陷入“守著金山要飯吃”的尷尬窘境。但好在 “開源” 的優勢為解決這些困境帶來了轉機。
在演講中,我們看到了DeepSeek掀起的“春節攻勢”背后的一系列昇騰行動:
在春節第一時間,昇騰和伙伴硅基流動共同作戰,迅速面向全國用戶第一時間提供DeepSeek的線上服務,解決了用戶因本地部署困難而無法使用 DeepSeek 的燃眉之急;
春節后的2周,昇騰圍繞融合算子、通信優化、并行加速、推理系統、強化學習五大方向實現工程技術創新,讓一體機性能翻番,同時昇騰率先完整復現Open-R1后訓練全流程,并將能力沉淀成套件和解決方案,開放給伙伴,讓更多企業能夠利用DeepSeek 開發出符合自身業務需求的創新應用;
春節后的一個月,已經有超過80個伙伴基于昇騰落地大模型應用一體機、國內25城人工智能計算中心都上線DeepSeek。150多家企業基于昇騰快速部署上線DeepSeek。
從實驗室技術到應用成果遍地開花,昇騰只用了1個月的時間。
為什么是昇騰?
在筆者看來,這場行動透露出昇騰在推動AI加速落地上的三個“度”。
第一個“度”,是支撐的“速度”,圍繞大模型的適配和性能釋放,昇騰可謂是馬不停蹄,爭分奪秒地進行快速響應、技術創新以及生態協同,在支撐AI落地千行萬業上成了引領者。
第二個“度”,是創新的“深度”,圍繞AI落地所出現的新問題,昇騰進行深度、全面的技術創新,保駕護航。例如困擾很多企業部署類MoE大模型面臨的算力成本高、并發能力弱、內存瓶頸顯著等問題,昇騰推出了大規模專家并行解決方案。通過將MoE模型的多專家權重數據分散部署到更多的卡上,降低單卡權重加載時延,讓模型解碼輸出更快;同時,單卡可提供更大內存容量支持更大用戶并發所需的KV緩存,實現系統的更大吞吐性能,推理引擎支持從單卡加速到大規模專家并行集群的極致加速。這個方案的本質是通過全棧技術的協同優化,突破混合專家模型在大規模部署中的效率瓶頸,實現性能、成本和資源利用率的最優平衡。
第三個“度”,是場景的“廣度”,在AI部署上,昇騰的創新是圍繞企業客戶的不同場景痛點進行創新,并助力伙伴抓住AI應用爆發的全場景。例如,圍繞企業輕量化部署AI的需求,昇騰助力伙伴基于昇騰發布一體機,從模型部署、推理加速到應用上線,昇騰能為伙伴提供了業界領先的方案支持,量化、調優等工具鏈顯著提升50%部署效率;圍繞大吞吐、低時延等高要求業務場景,昇騰攜手科大訊飛率先實現大規模專家并行集群推理解決方案;為了滿足客戶打造專屬“行業R1”模型的需求,昇騰率先打通從微調、蒸餾到強化學習的全流程,將能力沉淀至MindSpeed-RL套件等等,都是這樣。
“技術創新+生態開放”雙輪驅動,與行業“共昇騰”
《與時代 共昇騰》的演講透露了更多昇騰的相關信息和最新進展。
在昇騰人工智能伙伴峰會上,昇騰發布業界首個強化學習開發套件MindSpeed RL,其通過全棧技術創新和開源生態支持,解決了傳統強化學習在大模型應用中面臨的核心難題,全流程的工具鏈支持助力開發者無需從零構建復雜流程,顯著縮短開發周期,而算法與框架同源支持企業快速復現訓練流程,甚至適配千億級MoE模型的強化學習需求。同時,訓推共卡技術、異步流水調度優化等技術創新,實現了大模型RL訓練的“性能-效率-成本”平衡。
更重要的是,MindSpeed RL在Gitee上開源,其意義在于通過技術解耦與生態開放,讓強化學習不再是高門檻的科研工具,而是變成一種標準化生產力工具。用張迪煊的話來說,就是“讓每個企業都有機會打造屬于自己的‘R1模型’。”
這透露出昇騰的清晰運作模式,那就是“技術創新+生態開放”的雙輪驅動:一個輪子進行全棧的技術創新,不斷圍繞客戶和時代需要,攻克技術難題;另一個輪子是將技術創新開放給生態伙伴,賦能伙伴打造更有競爭力的產品和解決方案。
在過去的一年時間里,昇騰堅定圍繞硬件、算子、加速庫、模型及應用五大創新方向,攜手伙伴,共同發展。今年,昇騰將持續加大生態投入,從技術、政策、生態及激勵幾個維度持續為伙伴提供支撐。
在昇騰人工智能伙伴峰會上,張迪煊公布了昇騰在雙輪驅動上的諸多新進展。
例如,硬件使能層CANN深度開放,從上層圖引擎到底層運行時,從融合算子到通信算法,釋放硬件極致性能,使能伙伴及客戶自主創新。
例如,推理引擎MindIE持續升級,vLLM開源社區與昇騰的對接,讓開發者可以基于昇騰使用vLLM全量功能,而MindIE Turbo推理加速插件,可以為vLLM提供高階優化,吞吐可提升20%以上,實現極致性能。
例如,鵬城實驗室基于昇思發布GRPO強化學習訓練框架,率先突破了大模型強化學習全棧技術壁壘。昇思持續演進自然與萬千開發者的貢獻息息相關。
例如,剛剛發布的昇騰自動駕駛SDK,就聚合了昇騰在自動駕駛數據閉環、模型“天”級迭代上的技術創新模型性能提升30%以上,而套件的模型和算子全量開源在Gitee上,并提供豐富的參考設計,很好地體現出“技術創新+生態開放”這個雙輪驅動,所帶給伙伴和客戶在智駕訓練上的價值。
顯然,這種雙輪驅動,是AI發展和應用的最優解,昇騰可以聚焦在自己最擅長的產品和技術領域,而不同行業、不同階段的伙伴可以將自身對行業的洞察和積累與昇騰的技術創新相結合,實現差異化優勢,共同在AI時代弄潮。
這就是“與時代共昇騰”的真實含義。
后記:AI行業新范式
這段時間,筆者在行業做了很多采訪,一個深刻的感受是進入2025年,AI正在呈現出發展的新范式。
新范式之一,是從“訓練為主”到“訓推結合”,推理時代正在到來,對推理算力以及性能和收益提出了新要求。張迪煊指出,每次長思考的邏輯推理,都會帶來額外20倍的token生成,隨之而來的是百倍的推理算力需求。
新范式之二,是技術平權,AI的行業落地門檻在大大降低。正如張迪煊所說,AI自主創新的序幕已經揭開,高質量模型+后訓練范式大幅提升行業模型效果,降低了行業落地門檻,推動2025進入大模型應用元年。
新范式之三,是中國自主AI生態迎來難得的發展機遇。中國在大模型上與全球并駕齊驅,而開源特性也大幅降低了AI落地行業的門檻,進而推動越來越多的企業、高校、科研機構和開發者加入,人工智能產業在中國迸發出越來越旺盛的創新活力。
站在這些人工智能產業范式革命的角度,再來看昇騰在全棧技術創新與生態開放協同上的一系列舉措,可以清晰地看到,昇騰所做的一切,都抓準了AI范式革命的脈搏,通過技術創新實現AI算力釋放在性能和收益上的最好平衡,通過生態開放推動技術平權,讓AI加速進入千行萬業。
“與時代 共昇騰!”,不僅是華為提出的口號,更是昇騰生態伙伴以及千行萬業加速擁抱AI的時代強音。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.