算力生態的競爭,本質是技術深度與人才密度的雙重較量。
作者|云凡
編輯|栗子
在當前全球科技競爭日益激烈、核心技術自主創新問題凸顯的背景下,算力平臺的崛起與壯大,承載著國家信息產業自主可控的戰略使命。
在這場攻堅戰中,高校與科研機構作為重要的創新源泉,正發揮著不可替代的作用。
華南理工大學計算機科學與工程學院的教授、博導陸璐,正是一位深耕于此領域的代表。陸璐不僅擁有在證券軟件開發、微軟應用軟件架構優化等業界積累的經驗,更在回歸學界后,將研究重心聚焦于軟件體系架構、可靠性保障,以及尤為關鍵的AI算力平臺性能優化。
近年來,他帶領團隊與昇騰開展深度合作,致力于解決平臺面臨的性能挑戰,推動軟件生態的繁榮。
本文,「甲子光年」對話陸璐,深入了解他獨特的學術與職業歷程、其團隊在異構并行加速和算子創新方面的突破,以及他對芯片生態建設、人才培養的真知灼見,探尋國產算力邁向全球標桿的可能路徑。
1.破界者之路:從行業領軍到算力先鋒
陸璐教授的個人經歷,本身就體現了產業、學術和科研領域的有機結合。
1999年,陸璐在博士畢業后,并未直接留在學界,而是選擇了投身香港的金融科技前沿。作為香港首批優才計劃引進人才,他在東方匯理銀行從事了兩年證券軟件開發工作。
隨后,他進入微軟公司,專注于應用軟件架構優化。在微軟的工作,無疑為他打開了國際視野,深入理解了大型軟件系統的設計理念和性能瓶頸所在。
2005年,陸璐選擇回歸學術界,入職華南理工大學。
這一轉變并非簡單的回歸,而是帶著豐富的實踐經驗和對產業需求的深刻洞察。他在高校的教研工作,自然而然地將理論研究與產業前沿緊密結合。他的研究方向涵蓋軟件體系架構、軟件測試、軟件可靠與保障——這些都是構建復雜、穩定、高效軟件系統的基石。
隨著人工智能時代的到來,特別是近年來算力面臨的嚴峻挑戰,陸璐敏銳地捕捉到了新的科研制高點:在人工智能環境下的大模型算力優化和平臺性能優化。
“我們團隊近5年主要從事軟件體系架構、軟件可靠與保障設計,以及人工智能平臺下性能的算力,平臺的性能極致優化。”陸璐介紹道,“主要是針對國外主流廠商對我們國內算力的卡脖子,我們致力于在國內的平臺上把跑不起來的應用跑起來,跑起來的應用達到更好的性能。”
這個動作背后,揭示了性能優化與生態建設之間的內在聯系——只有平臺性能足夠優越,才能吸引并留住用戶,進而繁榮軟件生態,形成正向循環。這不僅是技術問題,更是事關國家計算產業發展的戰略高地。
2.昇騰攻堅:性能躍遷與生態突圍
陸璐團隊的一個重要合作伙伴,便是昇騰。
談及與昇騰的結緣,陸璐回憶起最初的契機:“最開始接觸昇騰,是華為的技術專家到我們學院做技術交流,當時了解到,在國內也有企業做類似于像國外廠商的硬件和軟件的體系架構。”然而,初步了解伴隨著普遍反映的問題:“很多高校老師和研究機構都反映昇騰的平臺不夠親和,用起來比較難受。”
正是這種“難受”的反饋,激發了陸璐的探索欲:“我就有了這個好奇,問題在哪里呢?”他決定親身實踐。
通過深入的編程和研究,陸璐團隊發現,一旦熟悉了昇騰的編程平臺,理解了其獨特的硬件體系架構,它并非想象中那么難以駕馭。“經過我們的整個這樣的優化,它的性能從50%提到100%,甚至在某些應用場景從200%—500%。”
性能優化的核心在于對異構并行計算的深刻理解和高效利用。
陸璐解釋了他們為何專注于異構并行加速:“在一個整機平臺里,不僅要考慮單純的算力卡,還要考慮CPU以及內存帶寬,三者緊密地聯合在一起才能達到最佳性能。”這意味著,要實現系統整體性能的最優化,必須統籌考慮CPU、NPU以及它們與內存之間的高效通信。這種復雜的協同優化,正是異構并行加速研究的價值所在。
他們的研究成果并非停留在論文研究階段,而是產生了實實在在的作用。
陸璐認為主要體現在兩方面。首先是開源,比如近期開源的模板生態庫,顯著降低了開發門檻,使廣大開發者能更便捷高效地利用昇騰算力,提升性能,從而繁榮了整個軟件生態。
其次,通過與華為計算產品線深度合作,將自研算子和編譯優化工具直接集成到其產品及基礎軟件庫中,有效提升了基礎軟件的性能并豐富了其內容。
陸璐告訴「甲子光年」,看到團隊的工作能夠幫助華為在基礎軟件庫層面實現性能提升和生態豐富,并最終服務于自主創新戰略,這讓他們感到無比的成就和自豪。
3.生態崛起:聚焦、夯基、聚才
展望算力生態的未來,陸璐的思考既有宏觀的戰略視野,也有微觀的實操建議。
他認為,芯片生態基礎建設是一個復雜且長期的過程。當前國內涌現出包括華為、寒武紀、曙光、百度昆侖芯等眾多硬件廠商,雖然在種類上可能多于美國,但陸璐強調要“集中力量辦大事”。在他看來,華為無疑是國內算力領域的“龍頭老大”,如何做好老大的角色至關重要。
關于國產算力何時能成為全球標桿,以及達成這一目標需要做對哪些關鍵事情,陸璐認為,如果十年后昇騰或其他平臺能夠達到被模仿、成為標桿的程度,最關鍵的是做對了以下三件事。
首先,夯實基礎算子庫。
任何高性能的大模型應用都離不開底層算子的強大支撐。只有將最底層的算子庫做得扎實,達到最優性能和最高精度,這才是整個計算平臺的基石。
其次,高效建設算子模板庫。
在基礎算子庫之上,構建高效的算子模板庫,能夠大大簡化應用層開發者的工作。通過更少的代碼實現更高的性能和效率,從而吸引并留住更多用戶。
最后,優化AI編譯器。
基于MLIR等開源編譯器進行深度優化,簡化各種應用的編譯過程,確保其能在目標硬件上高效運行。陸璐強調,這三點是提升昇騰平臺易用性、功能強大性、黏住用戶并最終實現引領的關鍵。
此外,生態建設離不開人才支撐。陸璐認為,要構建強大的人才洪流,核心在于實現硬件可得、軟件會用、知識普及。這三點對于人才培養至關重要,它能匯聚涓涓細流,最終形成人才的洪流,為算力邁向未來奠定堅實的人才基礎。
算力生態的競爭,本質是技術深度與人才密度的雙重較量。
唯有將“硬核技術突破”與“柔性人才培育”深度融合,才能實現從單點創新到系統領先的跨越。當國產算力平臺既能提供媲美頂尖硬件的性能,又能匯聚全球開發者的智慧時,中國不僅將在算力領域樹立標桿,更將重塑AI時代的創新版圖——這既是昇騰的使命,更是中國科技自立自強的必由之路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.