“我們在光芯片上實現了逾 100 波長復用的信息交互與計算,論證了高密度片上信息并行處理,為提升光計算芯片算力拓展了新途徑。”謝鵬對 DeepTech 表示。
近期,中國科學院上海光學精密機械研究所(以下簡稱“上海光機所”)謝鵬研究員團隊成功研制出世界首顆超高并行光計算集成芯片——“流星一號”,首次在光芯片上實現超 100 并行度的光子計算,創造了領域新紀錄。該光計算芯片在 50GHz 光學主頻下,理論峰值算力可達 2560TOPS,這一算力指標基本對標英偉達先進 GPU 芯片。
圖丨超高并行光計算芯片——“流星一號”(來源:該團隊)
研究人員圍繞光計算并行度這一關鍵瓶頸,提出了超高并行光子計算新架構,并自主研制出具有大帶寬(>40nm)、低損耗、可重構特性的光計算芯片。
謝鵬指出,擴展計算并行度是光計算性能提升的關鍵一環,可拓展算力邊界,也是呈現光子并行優越性的標志。
審稿人對該研究評價稱:“我認為這一成果標志著光計算系統在光譜處理和光學機器學習領域取得了重要突破。”
(來源:該團隊)
光計算憑借高主頻、高并行、大帶寬等天然優勢,通過提升并行度可顯著提高計算密度和算力。這種并行光計算架構在人工智能和數據中心等場景具有廣闊應用前景:
一方面,為具身智能、神經網絡(依賴大量矩陣乘法運算)、物理仿真(涉及多節點函數映射)和圖像處理等領域提供高效解決方案;另一方面,光子計算的低時延特性,也適用于端側小數據量但對時延性要求高的場景,如通信交換網絡、無人機集群等。
圖丨eLight 當期論文封面(來源:eLight)
近日,相關論文以《具備 100 波長復用能力的并行光計算》(Parallel Optical Computing Capable of 100-Wavelength Multiplexing)為題,以封面論文形式發表在eLight[1]。
上海光機所博士后于瀟、沙方圓、北京大學蔚姿奇(上海光機所實習生)為共同第一作者,上海光機所韓溪林工程師、新加坡南洋理工大學 Guangwei Hu 南洋助理教授和上海光機所謝鵬研究員擔任共同通訊作者。
圖丨相關論文(來源:eLight)
首次在光芯片實現超 100 并行度光計算,算力提升 2 個數量級
該架構的成功實現需要從系統層面統籌考慮多波長光源芯片、光交互芯片、光計算芯片、驅動芯片及算法等多個關鍵組件。這些要素之間的協同配合至關重要,特別是光學主頻、頻率間隔和器件帶寬等參數的精確匹配,是實現超高并行光計算系統的關鍵。
研究團隊構建了完整的片上光子計算系統:采用自研芯片級微腔光頻梳作為片上多波長光源子系統,其輸出光譜范圍>80nm,可支撐波長數>200;同時開發了高精度、大規模陣列光學矩陣運算驅動子系統,其可擴展通道數>256。
借助創新的波分復用技術和并行光電混合計算算法,成功驗證了超高并行光子計算模型,實現了并行度>100 的并行片上光子交互與計算原型驗證系統。
圖丨多波長復用并行光學計算架構(來源:eLight)
需要了解的是,在并行光計算架構的研發中,孤子微梳源發揮著關鍵作用。這一創新光源技術能夠提供超百個波長的信道,為構建片上并行架構奠定了基礎。從系統集成的角度來看,單個孤子微梳源可以替代上百個獨立激光器,不僅顯著降低了系統的體積和功耗,還大幅提升了集成度并有效控制了成本。
與傳統單波長光計算相比,在相同矩陣規模和光學主頻的條件下,超高并行光計算可通過波分復用提供超百路并行度,使算力提升 2 個數量級。
韓溪林解釋說道:“在不改變芯片硬件的情況下提升并行度,就像將單車道的高速公路改造成可并行通行百輛車的超級公路,進而大大提高單位時間內的吞吐量。”
實現整個系統的高效運行面臨諸多技術挑戰。在芯片設計層面,為支持百通道并行度,工作帶寬成為最關鍵的技術指標,它直接決定了計算芯片的并行處理能力。該團隊對芯片器件進行了特殊設計,確保器件具有足夠大的通光帶寬,并保持器件與芯片的帶寬一致性,降低信號串擾。
在操控系統方面,針對光計算芯片操控節點數量龐大的特點,研究團隊自主研發了高精度多通道光矩陣驅動子系統,以實現對光學矩陣的精確控制。此外,光源、光交互和光計算系統之間的兼容性問題也需要通過系統工程方法進行整體優化設計。
圖丨基于馬赫-曾德爾干涉儀的并行光計算模型(來源:eLight)
該研究的起源可追溯至 2018 年,當時,謝鵬以國家公派聯合培養博士生身份留學美國麻省理工學院,開始從事光芯片與高維光學神經網絡研究。之后,他分別在英國牛津大學和新加坡南洋理工大學持續從事相關光芯片研究,致力于解決高維光計算所涉技術難題,包括高密度信號串擾抑制、低時延信號高精度同步、跨尺度芯片集成等。雖然早期就有了系統的技術思路,但該課題方向涉及眾多學科交叉,需要光、機、電、算、控等,因此該科研想法一直未系統性完成。
2024 年夏天,他全職加入了上海光機所,組建了以 90 后、00 后為骨干的光芯片與光子計算團隊,目前已有成員 10 余名。這支平均年齡僅 28 歲的年輕團隊匯聚了國內外高等學府的優秀人才,學科背景涵蓋光學、電子學、數學、電子信息等。
謝鵬帶領團隊在平坦片上多波長光源芯片、大帶寬可重構光計算芯片和大規模光學矩陣驅動等多項關鍵技術上連續取得突破,最終推動了超高并行光計算原型機的成功研制(DeepTech 此前報道:科學家開發平坦片上多波長光源,有望用于大容量光互連和高維光計算)。
特別值得一提的是,該系統的所有核心光芯片(包括光源芯片、光交互芯片、光計算芯片)和光矩陣驅動板卡、算法模型均實現團隊完全自主研制。
謝鵬將其歸結為中國科學院有組織科研的優勢,他說:“在我們的團隊中,每個關鍵技術點都有專人負責深度攻關,這種點-線-面的科研組織方式,使得我們能在相對短時間內完成從基礎研究到系統集成的全鏈條創新。這也解釋了為什么我在國外好幾年未能解決的難題,回國后能在較短時間內取得突破,得益于中國科學院的科研體制優勢和上海光機所對年輕人的支持與信任。”
于瀟補充說道:“讓我印象深刻的是,面對任何技術瓶頸,團隊成員都會發揮各自優勢主動擔當。正是這種‘系統需要什么我們就研發什么’的科研精神,最終才實現了整個系統核心技術的高度自主可控。”
據介紹,目前超高并行光計算原型驗證系統已實現全鏈路貫通,并在關鍵部件自主研發方面取得顯著成效:團隊已實現光源、光交互、光計算、光探測、矩陣驅動等全自主研發,為后續高密度集成奠定了堅實基礎。
如何充分發揮光計算的優勢?突破“三堵墻”是關鍵
計算技術作為信息領域的核心支點,是推動人工智能時代持續前進的關鍵驅動力,其算力供給水平與人類社會的發展和進步息息相關。然而,隨著電子芯片已趨近物理極限,若持續縮小芯片尺寸將不可避免地引發熱效應和量子效應等負面問題;與此同時,電子計算對人工智能時代的支撐正面臨著能耗急劇攀升的嚴峻挑戰,亟需探索新的計算范式來滿足社會發展需求。
在眾多技術路徑中,光子作為玻色子具有獨特的優勢,如高傳輸速度、高并行性、高帶寬、低功耗和低時延等。以光子作為信息載體,實現高效的信息傳遞、交互、計算與存儲,已成為高性能信息處理是必然發展方向。這也使得基于光子技術的新一代超級計算機研發成為全球科學界競相追逐的前沿課題。
要實現光計算從前沿技術邁向實用性技術,必須充分發揮光子計算相對于電子計算的優勢,突破“矩陣規模”“光學主頻”和“信息并行度”這“三堵墻”:
- “矩陣芯片規模墻”:通過擴大光計算芯片的矩陣規模提升計算能力,該技術路徑主要受限于器件物理性質和制備工藝水平。
- “光學主頻墻”:通過提高光信號的加載速率實現更大計算能力,其受限于器件本身的性能。
- “信息并行度墻”:這是決定光計算能否實用的關鍵,需要通過多維信息復用的方式,實現更大的信息吞吐量。
圖丨并行光學計算的光譜一致性(來源:eLight)
回顧光計算的發展歷程,學術界和產業界近年來持續在光計算芯片的兩個關鍵性能指標——矩陣規模和光學主頻方面取得了顯著進展。在矩陣規模方面,臺積電研發的光計算芯片已達到約 512×512 規模,在光學主頻方面,美國加州理工學院團隊則實現了超過 100GHz 的突破。
而本研究最重要的創新點在于實現了光芯片的高并行度計算能力。需要特別指出的是,雖然當前研究成果在矩陣規模和光學主頻方面仍存在提升空間,距離超越最先進 GPU 芯片的性能還有一定差距,但研究團隊對未來發展持樂觀態度。
韓溪林指出,在當前工藝情況下,“矩陣芯片規模”和“光學主頻”提升有限且代價大,而突破“信息并行度”是光計算性能提高的極優選擇。其有望將光計算的算力能力提升 2-3 個數量級,使其達到與電芯片、電子計算同臺競技的性價比水平。
未來如果能將目前行業內最大的矩陣規模、最高的光學主頻和本研究實現的超百并行度這三個關鍵參數進行系統集成,從理論上來看,單芯片算力有望突破 5000POPS(注:1POPS=1000TOPS),這一性能相當于 1000 顆英偉達最先進芯片的算力總和。
在本次研究基礎上,該團隊制定了明確的發展路線圖。近期工作重點將聚焦于將光子的物理優勢轉化為實際計算優勢,通過持續優化整體性能來提升算力,實現“量變引發質變”的技術突破。
在中長期規劃中,研究人員計劃在大算力硬件平臺的基礎上,重點解決模擬計算架構與神經網絡數據模型的融合問題,通過系統級的架構設計和算法優化,最終構建完整的光計算生態系統。
研究團隊特別強調,片上光子網絡和光子相互作用仍具有巨大的探索空間,未來將通過構建高度集成的復雜光網絡系統,深入挖掘光與物質相互作用等物理機制,充分發揮光計算在大帶寬、高并行等方面的天然優勢,實現更復雜的計算任務處理能力。
在接下來的研究階段,該團隊瞄準光計算在人工智能、數據中心等應用場景,將逐步推動應用落地工作,以期盡快實現技術成果的轉化應用。
參考資料:
1.Yu, X., Wei, Z., Sha, F. et al. Parallel optical computing capable of 100-wavelength multiplexing.eLight5, 10 (2025). https://doi.org/10.1186/s43593-025-00088-8
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.