智東西
作者 云鵬
編輯 漠影一、深度開放夯實開發者武器庫,兼顧效率性能,三大核心技術突破重構AI算力基因二、30+產學伙伴入局,中國智算擁抱昇騰AI生態,海量AI底層創新涌現三、昇騰CANN跑出“中國速度”,從技術到商業生態閉環,為AI自主創新打牢基建結語:AI底層創新突圍,開放生態+技術創新是必由之路
今天,AI技術發展呈指數級增長,而AI創新也逐漸走向更底層的算法創新。
一味追求超大模型規模、超高硬件算力已經不再是主流,通過底層算力架構和前沿算法創新,硬件性能得以更充分地釋放、模型在實際應用中的性能實現暴漲。
一系列底層技術革新讓AI創新加速涌入千行百業。
我們看到,行業更加聚焦AI在具體場景、具體應用中的實際表現,關注模型實際解決任務的效率和成本,模型如何從可用能用走向易用好用?
這樣的行業大背景下,AI開放生態的發展完善變得至關重要,AI創新蓬勃發展、真正實現AI普惠,必然需要百花齊放而非一枝獨秀。
一方面,開放生態能更好地激發創新,讓技術可以更快速地迭代,大幅提升企業和開發者的創新效率;另一方面,開放生態可以更好地形成合力,事半功倍,加速AI普及,讓整個市場蛋糕更快做大。
在今年的鯤鵬昇騰開發者大會上,華為昇騰秀出了諸多重磅技術升級,通過構建全棧開放生態、高能效的算力底座賦能開發者,這種加速AI涌向千行百業的開放模式具有極高行業價值:真正自主可控的中國AI創新基座,正愈發堅實。
作為昇騰AI核心軟件平臺的昇騰異構計算架構CANN,無疑是此次大會的焦點,其分層開放策略,計算、通信、內存等領域的硬核技術迭代創新,都是推動AI開發效率與性能提升的關鍵。而諸多行業巨頭基于昇騰CANN技術和生態實現的優秀案例,都證明其在實際應用場景中落地的巨大潛力。
昇騰CANN,正為中國大模型創新提供更堅實的底層支撐,帶來更多機遇。
創新與開放在AI新時代可以說是強綁定的兩個關鍵詞,唯有開放,才能更好地促進創新。
直觀來看,昇騰CANN是連接昇騰硬件算力和上層AI應用的關鍵,是真正實現硬件高效使能AI的核心技術平臺。當下,如何實現AI在具體場景、具體產品中高效落地已經成為行業焦點,結合自主可控需求的高漲,昇騰CANN的重要作用不言而喻。
自2024年宣布深度開放以來,昇騰CANN的開放深度、開放策略一直在持續迭代,華為昇騰計算業務總裁張迪煊在大會上提到,使能每一位創新者,激發創新潛能,就是昇騰CANN的核心理念。
▲華為昇騰計算業務總裁 張迪煊
2024年5月,昇騰AI開發者峰會官宣了深度開放策略,支持開發者基于昇騰進行大模型原生創新;同年7月,昇騰CANN關鍵的高層組件開放代碼到Gitee社區,客戶和合作伙伴開始進行自主創新,一系列優秀案例加速涌現。
從能用到好用、易用,六年多時間里,昇騰AI生態穩步迭代,昇騰CANN也在不斷進化。從2023年大模型爆發浪潮中構筑能力、厚積薄發,到2024年深度開放,幫助客戶加速落地,再到2025年創新走向底層,行業對極致性能的需求越來越高,同時需求差異化愈發凸顯,CANN不斷迎來新的挑戰。
可以看到,CANN的開放是與產業變化共同成長的,是有生命力的,是真正從產業中來到產業中去的,能夠幫產業解決問題,帶來價值的。
今天,從Ascend C算子編程語言、AOL算子加速庫、GE圖引擎、HCCL集合通信庫、畢昇編譯器、Runtime運行時到Driver驅動,昇騰CANN不斷豐富高層、底層組件,充實開發者們的武器庫,與AI創新扎向底層的大趨勢齊頭并進。
開放生態是否優秀、能否得到行業認可、形成良性閉環,有兩個比較直觀易懂的評價維度:一個是開放模式是否易用適用、一個是開放的東西到底夠不夠好用。
分層開放是昇騰CANN一直堅持的開放模式,可以更好地讓開發者匹配場景需求,進而兼顧算子性能與開發效率。有豐富的參考樣例支持匹配場景魔改,進而實現敏捷開發;底層原子級能力支持靈活組合,讓開發者可以更好地挖掘硬件性能。
昇騰CANN針對不同技術層級的開發者推出了差異化開放策略。比如在算法創新層,開發者可基于業務場景進行”魔改式”創新;在系統優化層,CANN開放了190多個底層接口,得以釋放硬件的原子級能力。
在編譯生態層,通過開放畢昇編譯器的AscendNPU IR接口,開發者可以在接入Triton后直接使用Python語法編寫高性能算子,底層硬件差異被完全抽象化,這可以說是開發范式的變革。
除了分層開放架構對開發效率的提升,昇騰CANN在核心技術層面的突破是AI算力重構、硬件性能充分釋放的關鍵,計算、內存、通信可以說是實現這一目標“三駕馬車”。
計算層面,針對MoE大模型訓練場景的”卡脖子”難題,昇騰CANN推出了超級算子MLAPO,將MLA前處理耗時從行業平均109ms壓縮至45ms,在金融風控模型、廣告推薦系統中實現了20%以上的端到端性能提升,打破Transformer架構的算力瓶頸。
內存層面,面對動態shape場景的”內存碎片化”痼疾,CANN研發的多重地址映射技術可以實現內存碎片的自動化拼接利用,讓京東商品搜索、騰訊短視頻推薦等業務場景的內存利用率提升了20%以上,突破了單卡可承載并發請求量行業極限。
在分布式訓練領域,CANN打造的NPUDirect通信算法將傳統RDMA通信所需的3對同步精簡為1次原子操作,讓科大訊飛語音大模型的跨機通信時延下降了90%,走通了萬卡級分布式訓練可行性路徑。
值得注意的是,技術領先的基礎是架構層面的領先,昇騰NPU+昇騰CANN的模式徹底打破了海外主流算力平臺的獨大,在效率、成本上都實現了快速看齊甚至是超越,這是中國自主可控AI算力架構底座的底氣所在。
可以看到,三個領域的核心技術突破形成的協同效應,一方面實現了單點性能的指數級提升,同時構建起了“芯片級優化+系統級調度+集群級協同”的全棧能力,AI算力技術正式邁入”原子級精準調優”的時代。
昇騰CANN已經為行業搭好舞臺,隨著深度開放策略的逐步深化,各路行業頭部企業、優秀開發者以及高校團隊都亮出了諸多亮眼的創新成果。自主可控的中國AI底層創新所涌現出的巨大潛力,令人欣喜。
從巨頭到創企,從高校到個人,我們看到昇騰CANN正在諸多領域加速AI創新的涌現。
比如科大訊飛的訊飛星火大模型X1就基于Ascend C進行了極致軟硬協同優化,雙方團隊針對諸多關鍵算子進行了共創共研,性能收益十分顯著。
科大訊飛副總裁、AI工程院院長潘青華提到,訊飛和昇騰的結緣可以追溯到2019年,訊飛使用昇騰從敢用、真用、會用到用好走過了四個階段,今年3月,訊飛基于昇騰算力率先實現了MoE模型大規模跨節點并行集群的推理,整個推理的性能提升了3倍。
作為AI Infra創企的無問芯穹也與昇騰一起,基于CANN進行深度優化創新,針對大模型推理集群部署中的通信開銷問題進行技術攻關,實現單算子性能提升20%,顯著降低了算力資源消耗。
可以看到,如今算法和應用的創新已經從單點創新變成了軟硬協同的系統性創新,昇騰與企業之間的合作就更為重要,算法和應用對于硬件的需求可以被更早的傳遞。AI算法應用可以跑的更穩、跑的更快,CANN正幫助企業以更低成本、更高性能加速AI應用落地。
在高校科研領域,清華大學計圖團隊聯合昇騰研發的MoE專用算子體系,通過調用aclGraph模型調度接口與INT4量化技術,將DeepSeek-R1模型的推理時延降低50%,驗證了原子能力組合創新的巨大潛力。
西北工業大學軟件學院副教授徐韜團隊基于CANN平臺構建垂直模型,通過多模態感知技術對抑郁癥患者進行初篩,整個系統目前已經部署到西安交大第一附屬醫院。
功能足夠強大、生態優秀,同時自主可控,這是徐韜教授團隊最看重三點,也是昇騰CANN的優勢所在。
華南理工大學計算機科學與工程學院教授、博士生導師陸璐提到,他們從2022年就開始了與華為的合作,他們希望能在國內平臺上“把跑不起來的應用跑起來”,達到更好的性能。
▲華南理工大學計算機科學與工程學院教授、博士生導師陸璐
在探索中他們發現,只要熟悉昇騰編程平臺,了解其體系架構,經過不斷優化,性能可以從50%提升到100%,甚至在某些應用場景達到200%到500%。
值得一提的是,高校科研成果可以與昇騰CANN生態融合,進一步促進雙方的共同成長,給產業帶來更大價值。
比如陸教授團隊參與開源的模板庫就可以提升開發者的開發效率,同時,團隊開發的算子以及編譯優化的工具可以直接嵌入到CANN中,提升昇騰基礎軟件庫的性能。
我們可以看到,昇騰CANN平臺是一個開放性平臺,同時也是一個成長性平臺,只有產學界各方加入到生態當中,共同繁榮生態圈,才能使其更好的進步。
除了與企業和高校碰撞出火花,昇騰CANN同樣給個人優秀開發者帶來了巨大價值和影響。
天津理工大學電氣工程與自動化學院人工智能專業2022級學生王富平從2023年就開始參加昇騰AI創新大賽,隨后一直扎根昇騰AI技術中,在昇騰CANN異構計算架構等領域都進行了研究探索,廣泛參與各類創新大賽并取得創新成果。
▲王富平
王富平也成為了首屆“求實創新班”成員,天津市首位華為開發者布道師。昇騰AI讓諸多優秀個人開發者有機會接觸最前沿的技術和知識,在實現個人價值的同時貢獻更多社會價值,昇騰CANN生態也在諸多優秀開發者的支持下快速成長。
從產業、科研到個人,昇騰CANN給中國科技帶來的影響必將是深遠的。
目前,昇騰已經聯合互聯網大廠、運營商、大模型廠商等30多個客戶伙伴創新孵化出260多個高性能算子,覆蓋了主流AI場景,平均整網性能提升超過10%,這無疑是技術創新和商業落地的雙重突破。
與此同時,昇騰CANN社區已經上線了超過15個HCCL通信算法及API。通信領域昇騰聯合10多個客戶伙伴實現了平均50%以上的通信效率提升。
從硬件廠商到模型廠商,從底層算子算法創新到上層訓推平臺創新,從高校個人到科研團隊,昇騰CANN創新生態的深度廣度都在快速拓展,中國智算產業中堅力量悉數到場。
今天,廣大企業開發者和個人開發者紛紛將創新成果進行分享,為昇騰生態不斷添磚加瓦,中國AI創新的共贏故事,正在各個行業各個領域開花結果,CANN給產業帶來的價值正愈發凸顯。
根據昇騰官方數據,6年來,有超過60萬開發者了解CANN、使用CANN、賦予CANN創新活力,在昇騰CANN持續推進開放,以及產業各方開發者、企業積極參與之下,CANN生態正在快速成長。目前CANN的算子認證開發者已經超過了6000人。
從整網性能和通信效率顯著提升,到大模型推理性能的暴漲,再到構筑覆蓋模型開發、訓練加速、部署優化的全鏈路技術生態,CANN正在加速使能多維度創新。
很多人將昇騰CANN比作“中國版CUDA”,但實際上,CANN用6年時間就走完了CUDA十幾年的路,這本身已經是一個奇跡。如今基于昇騰NPU+昇騰CANN技術生態所能實現的AI應用性能已經能夠看齊甚至超越CUDA,這更是難能可貴的。
而這遠不是終點,相比CUDA,昇騰CANN生態顯然在開放的廣度、深度上都更進一步。作為后來者、挑戰者的昇騰,并不會像CUDA一樣構建技術壁壘,而是會始終堅持開放,昇騰希望給開發者提供一個更加自由的平臺,真正給中國AI創新應用底層鋪路筑基,釋放中國AI創新的巨大潛力。
昇騰CANN正在用一種“基礎層開放+應用層共創”的雙輪驅動模式,推動國產AI產業鏈的協同進化,形成從技術突破到商業轉化的生態閉環。
如今有越來越多的企業在昇騰社區上獲取到有價值的技術,進一步加速自身的商業成功,也有越來越多的高校學者、研究團隊在昇騰CANN生態中取得科研成就,進一步實現社會價值。
正如陸璐教授所說,他們基于昇騰平臺的研究得到了社會的認可,實現了更好的效果,幫助國內平臺真正做到了自主創新,提升了我國的算力水平,這是他們團隊獲得最大成就感的地方。
昇騰CANN正不斷加速基礎軟件算法創新,促進多樣性計算產業發展和生態繁榮,如今的CANN正在成為中國開發者生態最活躍、技術迭代最迅猛的AI創新平臺。
與此同時,昇騰CANN也基于昇騰開放平臺提供了完善的人才培養機制,從教學、培訓、研究到各類舉辦各類賽事,頂級AI創新人才不斷涌現。
對于中國AI產業來說,昇騰AI生態是實現自立自強的堅強依靠,也是國內科技企業去構建自主創新的AI基礎設施的必然選擇。
可以看到,從分層開放的生態架構到計算、內存、通信等領域的一系列底層技術突破,昇騰CANN一手開放、一手技術,正給產業帶來AI創新的新范式。
面對未來的AI新時代,技術的變革不斷加速、生態體系的構建越來越重要,CANN正成為中國優秀開發者們越來越熟悉、越來越認可的“伙伴”,從可用能用到易用好用,逐漸走向舞臺中央,屬于昇騰CANN的時代,正拉開帷幕。
這不僅是一場硬件算力的革命,更是一場開發者與技術的共同進化。昇騰CANN正幫助中國AI產業中的企業和開發者不斷突破底層算法創新的瓶頸,釋放潛力,推動中國AI發展從追趕走向引領。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.