智東西
作者 陳駿達
編輯 漠影
全球科技競爭日益激烈,以AI為核心的新一輪技術革命推動算力需求呈指數級增長,而高性能、自主創新的計算基礎設施的重要性也與日俱增。在此背景下,構建繁榮、開放的計算生態體系,培養頂尖創新人才變得尤為迫切。
在今年5月舉辦的鯤鵬昇騰開發者大會2025(KADC 2025)上,國內多所重點高校集中展示了基于鯤鵬昇騰技術路線的科研成果。
北京大學的Open-Sora Plan V1.5依托昇騰MindSpeed MM多模態大模型套件進行訓練和優化,實現電影級視頻生成。
清華系初創企業趨境科技推出的KTransformers框架基于鯤鵬CPU與昇騰NPU的異構協同優勢,實現單卡運行千億參數模型的突破。
上海交通大學的科研團隊基于鯤鵬處理器自研了分子模擬高RBE算法,顯著提升了計算效率,有望成為下一代分子動力學引擎發展的核心技術。
而上述成果僅僅是冰山一角。回顧去年的KADC大會,華為宣布與清華大學、北京大學、浙江大學、上海交通大學、中國科學技術大學5所高校開展合作,共同成立鯤鵬昇騰科教創新卓越中心,截止到今年KADC的舉辦,華為又新增了7所鯤鵬昇騰科教創新孵化中心高校的簽約合作。
隨著合作院校的擴展,有越來越多的高校算力集群平臺獲得了鯤鵬昇騰科教創新卓越/孵化中心提供的算力支持,為計算系統創新、科學應用創新提供了堅實底座。
一、北大華為:算力+平臺協同效應顯現,模型推理吞吐暴增200%
在北京大學于本屆KADC 2025大會上發布的前沿成果中,Align-Anything框架無疑是焦點之一。作為全球首個開源的全模態對齊微調框架,Align-Anything解決了現有框架僅支持單一或少數模態對齊的問題,在一個模型內實現了圖像、語音、視頻、動作等模態的對齊。
其科研價值體現在多個方面:它支持任意到任意模態的對齊,開源了包含12種模態的200k對齊數據集,以及涵蓋多個主流對齊微調算法(如SFT、RLHF、DPO、GRPO)的訓練代碼。
此外,Align-Anything通過采用信息更豐富的多模態偏好數據(例如文本、圖文音頻等反饋,而非二元偏好),實現更準確、更細粒度的對齊,有效減少多模態融合帶來的幻覺問題,在具身智能等場景下具有顯著意義。
這種前沿的全模態大模型對齊研究,對底層高性能算力基礎設施提出了極高的要求。那么,北京大學是如何構建并支撐這些創新研究的算力底座呢?
北京大學基于鯤鵬昇騰硬件,構建了北大卓越中心集群,為Align-Anything等前沿AI研究提供了堅實的算力支撐。從底層硬件到上層應用,該集群的技術棧均實現了自主創新。
其中,鶴思算力調度系統和SCOW(Super Computing On Web)算力平臺系統是核心組成部分。鶴思是北大自研的開源調度系統,起初為解決海量小任務和超大規模集群性能問題。
隨著國產化進程加速,鶴思強大的兼容性使其能適配包括鯤鵬、昇騰在內的國產計算設備及相關生態,實現高性能計算和智能計算場景下的資源、作業管理等功能。
SCOW平臺則為用戶提供便捷的可視化界面,大大降低了用戶使用高性能計算資源的門檻。2024年,SCOW發展出SCOW for AI版本,專門面向AI計算中心,提供AI全流程的開發與部署輔助系統。
以Align-Anything為例,鶴思能夠為其訓練與推理提供高效的資源調度和管理,確保模型在昇騰NPU上的穩定運行,而SCOW則能夠輔助其從數據集管理、算法管理、模型管理、訓練管理等在內的AI訓練完整流程。
鯤鵬昇騰科教創新卓越中心為北京大學的上述算力平臺提供了從國產化算力底座到完備軟件生態的全領域支撐。
在智東西與北京大學計算中心系統管理室主任樊春的交流中,我們了解到,根據北京大學用戶一手體驗后的評價,目前鯤鵬CPU的性能已經與國外傳統CPU廠商基本拉齊,同時昇騰NPU在硬件性能、軟件生態方面也正在迅速發展。
昇騰生態方面的變化給樊春留下了極為深刻的印象。在過去5年中,他明顯感受到昇騰生態不斷完善,逐漸能夠適配大量的主流開發工具,程序、模型的移植只需幾行代碼就能完成。
目前,昇騰異構計算架構CANN已經迭代至8.0版本,創新開發100多個融合算子,覆蓋MoE、多模態等主要場景,顯著提升大模型性能。
此外,CANN還支持安裝PyTorch拓展前端,這意味著用戶可以直接在昇騰設備上選擇PyTorch作為前端推理框架,極大地便利了開發工作。
MindSpeed支持多種主流訓練框架,方便科研人員靈活切換,其支持的Megatron訓練框架,從并行策略、內存優化、親和計算、通信優化等四大場景支持大語言模型、多模態模型等訓練場景優化。MindIE、vLLM昇騰插件等工具幫助實現運行加速、調試調優和快速遷移部署。
在本屆KADC大會上發布的Align-Anything框架就是昇騰生態的受益者之一。通過CANN的算子自動融合和vLLM昇騰插件等優化,Align-Anything節省了14.9%的訓練時間,并提高了近200%的Tokens吞吐量。
樊春透露,北京大學 鯤鵬昇騰科教創新卓越中心的算力使用率維持70%左右,在高峰期常常能達到90%甚至是100%。用戶對鯤鵬、昇騰產品的直觀感受是“程序跑得通”、“性能還不錯”,用戶滿意度較高。
這些用戶的直觀感受和真實數據,充分體現了鯤鵬昇騰科教創新卓越中心在構建高性能、易用性強的算力底座方面的全面支撐,有效推動了前沿AI研究的創新與發展。
二、上交?華為:“交我算”鯤鵬算力助力科研,自研分子模擬算法實現突破
本屆KADC 2025大會上,上海交通大學的科研團隊也帶來了在鯤鵬、昇騰支持下的最新科研成果。該校的徐振禮教授團隊在鯤鵬處理器上實現了高精度、高效率及高擴展性的分子動力學模擬計算。除了算法本身的創新之外,這一研究成果也離不開上海交通大學自主研發的“交我算”平臺的支持。
“交我算”自2013年開始建設,經過多年的發展,已建設成為國內領先的高校算力平臺。鯤鵬昇騰科教創新卓越中心建成后,相關算力資源也接入了“交我算”平臺,進一步擴展了其計算能力。
“交我算”目前涵蓋云計算平臺、AI計算平臺、高性能計算平臺、科學大數據平臺等,通過構建統一的聚合門戶,為用戶提供一致的計算服務體驗。
其實,早在2021年,上海交通大學便在“交我算”平臺中上線了鯤鵬超算系統,這是國內高校第一個,也是目前規模最大的校級鯤鵬超算系統,擁有100個計算節點,共計12800個CPU核,過去數年中,鯤鵬超算支持了上海交通大學物理學、化學、生命科學、材料學等不同領域的科研項目,獲得不少好評。
鯤鵬昇騰科教創新卓越中心建成后,據上海交通大學物理學院的一位教授分享,他們在交我算的鯤鵬超算上進行了大規模的蒙特卡諾模擬,ARM平臺的效率甚至比自有的小型服務器快了1.5倍多。
上海交通大學材料學院的一位教授則稱,“交我算”鯤鵬集群多核并行效率很高,遠遠超出想象,跨節點并行同樣具有很好的效率。平臺軟件比較齊全,可無縫銜接,極為方便。
交我算平臺所使用的鯤鵬處理器基于ARM指令集。該平臺打造了多核集群架構,單節點配備128核,尤其適用于并行計算場景。這為“交我算”平臺上的諸多科研項目提供了優化方向。
徐振禮教授團隊的科研項目,便充分發揮了鯤鵬處理器的多核并行計算能力,團隊使用MPI并行編程模型開發,對創新自研RBE算法實現了進程級并行。鯤鵬處理器還支持ARM NEON向量化指令集和鯤鵬數學庫,實現了數據級并行,進一步提升了算法的運行效率。
鯤鵬昇騰科教創新卓越中心也支持了上海交通大學許多其他的科研項目。上海交通大學醫學院的一篇科研論文,就是在鯤鵬平臺的支持和卓越中心的計算資源保障下,登上了國際期刊Nature的子刊。
更為側重AI計算能力的昇騰,不僅給上海交通大學的AI相關研究提供算力支持,也將AI帶到了課堂教學之中。
基于昇騰算力本地化部署的國產模型,已成為了上海交通大學AI應用平臺的新一代大模型底座,給高等數學、概率統計、線性代數等課程的數學深度推理AI學習工具帶來升級,支持了從科研到教育實踐的全鏈條創新。
結語:鯤鵬昇騰深耕高校,培育未來自主創新人才
鯤鵬昇騰科教創新卓越/孵化中心與國內高校的緊密合作,正在構建一種創新性的產學研協同創新范式,這種合作模式并非只是簡單的硬件設施供給,而是致力于打造一個完整的自主創新人才培養生態系統。
這種模式首先為高校教育注入了產業活力。鯤鵬昇騰科教創新卓越/孵化中心將實際應用中的真實案例、前沿技術和行業標準帶入課堂,豐富了教育的場景,有效彌補了產教之間的鴻溝。
對高校學生而言,鯤鵬昇騰科教創新卓越/孵化中心讓他們于在校期間就能接觸鯤鵬、昇騰技術,并完整參與國產技術體系的實踐。這種模式讓人才培養不再滯后于產業發展,而是實現了與產業需求的同步,不僅為學生們贏得了顯著的職業發展優勢,也為產業的未來發展儲備了強大的智力資源。
同時,高校的創新能力與企業的工程化能力通過算力平臺實現有機結合,最終加速了科研創新成果的產出,并促進了科研成果的快速轉化和落地。
從更為宏觀的角度來看,鯤鵬昇騰科教創新卓越/孵化中心通過與高校的緊密合作,提前培養了一批兼具“國產技術基因”與深厚專業素養的人才。他們不僅具備過硬的技術能力,而且對以鯤鵬昇騰為代表的自主技術有著深刻的價值認同與情感歸屬,有望成為未來科技創新的“種子”。
展望未來,這種模式有望逐漸形成一個良性循環的生態系統。企業與高校聯手培育大量優質人才,而人才在高校科研過程中積累的知識資產,將為產業升級提供助力,進而反哺整個產業生態的蓬勃發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.