“具身智能”和“智能機器人”首次出現在了今年的政府工作報告中,這一產業出現大爆發的最確定性因素已經具備。
毫無疑問,這一領域將成為中美爭奪全球AI創新策源地的競爭中,繼大模型和自動駕駛之外的第三個二十年級別的超長賽道。
甚至,如果和目前如火如荼的自動駕駛賽道相比,具身智能領域發展到2030年的規模,或將是自動駕駛賽道規模的三倍。
隨著產業的爆發,具身智能企業所需要的基礎設施將面臨一個建設高潮,而我們需要警惕的是,從存力角度來看,在此前一輪智算建設熱潮中所凸顯的一些結構性問題,如存算比嚴重不合理、存儲子系統性能前置升級空間不足,性能無法滿足行業需求等,應當成為這一領域的“危思”而得到高度重視和妥善解決。
——導語
01
踩過的坑,不要再踩
根據Allied Market Research數據,自動駕駛的全球市場規模預計2030年將達5570億美元;而根據IDC預測,到2030年全球具身智能市場規模將達1.5萬億美元,年復合增長率(CAGR)達25%,是前者的三倍。
埃隆·馬斯克的計算方式更為夸張,他曾經表示,從終局來看,假設未來會形成100億臺機器人的市場,按2萬美金一臺,會形成200萬億美元的終局大市場。
而對于業內人士來說,具身智能板塊,將會如同蘋果產業鏈、特斯拉電動車產業鏈一樣,形成一個超大規模的產業鏈體系。
國內的研究機構也注意到了這一趨勢,2025年的中國人形機器人生態大會中特別設立了“生態鏈卓越企業”的獎項,曙光存儲成為這一獎項的得主;這并非偶然,因為在賽迪《中國分布式存儲市場研究報告(2025)》中,曙光存儲已經成為具身智能存儲市場份額第一,同時連續兩年在AI存儲市場份額第一。
這也并非幸致——具身智能加速發展的核心動力,是大模型的快速進步。如在“大腦”方面,大語言模型的飛速發展,推動著機器人從傳統的規則控制模式向自主學習模式轉變;在“小腦”方面,通過引入機器學習技術后,機器人能夠更加精準地感知、采集和理解周圍的環境信息,實時構建更高精度的空間模型。
但這也對具身智能行業的基礎設施提出了極大挑戰,這一行業的形態決定了對大模型的擁抱熱切程度,而隨之而來的就是超大規模數據的處理和存儲問題。
“具身智能將是一個超級吃存力的賽道”,曙光存儲副總裁張新鳳說:“這一領域的數據特征可以用4個‘超’來形容——超大規模的訓練數據、超多模態的數據采集、超多終端的數據反饋、超級依賴計算機仿真能力,這一切產生的數據壓力都將傳到具身智能領域基礎設施的存儲子系統上,對先進存力和建設標準的需求都是空前的”。
如果你和筆者一樣參觀過國內某頭部人形機器人企業,就不難理解這一點——這家企業擁有一個堪比體育館體量的訓練中心,被分為無數的“格子間”。每個格間中都有專人負責某一個拆解動作的訓練,其數據采集涵蓋6類本體7大典型場景,日均采集數萬條數據……而在另一家頭部企業,為了及時傳送采集數據,甚至要動用卡車去運輸硬盤。
但這樣的情景只是問題的A面,B面則是中國具身智能產業仍處于極早期,行業集中度很低。具體來說,頭部企業企業所占市場份額不足20%,而每年新增數百家創業企業,使得行業更為分散。
“就目前而言,中國具身智能賽道的集中度不高、參與主體體量偏小,所以擁有千卡以上的智算集群的企業并不太多,很多問題也沒有暴露出來”,業內人士認為:“這恰好是一個非常好的時機,使得具身智能企業可以吸取此前各類智算中心建設中的經驗,如存算比嚴重不合理的現象,讓新的企業不必再踩已經被踩過的坑”。
02
“超級隧道”通向具身智能的未來
曙光存儲提出的 “超級隧道HyperTunnel”不是一個產品,而是一套系統化方法論,并真實具象于產品和技術之中。例如,分布式全閃存儲中的“五級加速”就是這種理念的成果,這項獨特能力也幫助曙光存儲連續兩年拿下中國AI存儲市場第一……這種體系化的性能天花板還留有很高的空間,將持續為客戶、同時也為曙光存儲的性能提升指明進化方向。
如前所言,具身智能的訓練、推理和計算機仿真中,具有“超大規模的訓練數據、超多模態的數據采集、超多終端的數據反饋、超級依賴計算機仿真”等特性,這意味著其對于存儲子系統的要求極高。
而曙光存儲的AI存儲方案能夠在這一領域擁有很高的市占率,說明了其無論是技術性能上,抑或是性價比上,都處于行業領先地位。
但這并非朝夕可至,它在曙光存儲從20年前開始獨立研發底層的分布式文件系統之時,就已經埋下了種子。
曙光存儲并沒有顛覆存儲系統的基本架構,但在這個前提下,它集中實現了由無數微創新組成的極致優化,這種優化的幅度之大,其實已經相當于某種程度上的顛覆。
針對AI領域的特性,曙光存儲提出了“超級隧道”的技術理念。可以說,這種理念是曙光存儲當前的核心技術創新之一,它的特點之一,就是具有廣泛的AI親和性。
“隧道”亦可以理解為“通路”,“超級隧道”則可以理解為對于存儲中數據流動和處理的極致優化,通過硬件與軟件的深度協同優化,為泛AI賽道的存儲子系統提供了構建高效、低時延數據傳輸路徑的解決之道。
例如,當前先進存儲的一大趨勢,就是盡量減少存儲操作對于CPU的開銷,讓數據“繞開CPU走”。所以,“超級隧道”中采用了XDS技術,這一技術實現了將數據直接加載到GPU中,提高訓練過程中數據集的加載及處理速度。
更具象的說,曙光存儲的XDS技術創新還體現在不僅支持GPU,也支持多款算力端智能芯片直接存取數據,從而簡化了存取過程,降低了CPU與緩存壓力,更節省了硬件資源。
存算一體,也是一個智算行業一直在無限逼近但仍有極大創新空間的領域,曙光存儲則在AI節點中采用了BurstBuffer技術以實現這一理念,它利用服務器的NVMe盤來緩存數據,使之接近于內存的效果但容量卻大很多,可以緩存大量數據,進而能夠保證海量數據不用跨網絡訪問存儲,僅此一項就可以把讀取性能提高幾倍甚至十倍以上。
“超級隧道”中還有許多令人驚嘆的微創新,該架構為每個CPU核配備獨占資源,構建起從網卡到CPU再到硬盤"一桿子插到底"的“超級隧道’。
這里看似在談硬件,實際由軟件邏輯層面實現——也就是從微控視角對數據進行切分,使得不同邏輯空間關聯的硬件資源相互隔離,就像構建了多條垂直“隧道”,I0數據從入到出,整個過程都在同一“隧道”內完成,實現數據就近訪問,大大提升了性能。
具身智能的研發,一大特征是需要整合視覺、觸覺、語言等多模態數據,例如人類操作視頻、仿真訓練測評、三維空間信息等,這些數據格式多樣、體量龐大,對存儲系統的容量和讀寫速度提出更高要求。
更重要的,是不同數據需要不同的協議支持。為了充分發揮先進存力的融合屬性,曙光存儲支持了業界幾乎最全面的多種存儲訪問協議,使得異構數據無需格式轉換即可一路暢通,避免數據跨存儲系統復制帶來的各種弊端。
在產品層面的打造上,曙光存儲也做到了極致性能。在分布式產品中,以2U規格機型為例,實現了190GB/s 帶寬+500萬 IOPS的超高性能,在同類別產品中處于斷層式領先。
而在集中式存儲產品中,通過建立無鎖化的數據IO“超級隧道”,曙光存儲的FlashNexus實現了全球性能第一,即基于32控能實現3000萬IOPS性能+202微秒響應時延(基于百控則可實現億級IOPS),用于對性能最苛刻的推理環境中,為AI推理的向量數據庫、KV Cache長文本存儲等需求提供了更優方案。
事實上,盡管人形機器人始終是大眾眼中最有代表性的具身智能產品。但事實上,具身智能可以包括一切封裝了智能能力的實體硬件,人形機器人目前占比僅僅10%左右——而從“低空經濟”的主角無人機到“智慧交通”領域的自動駕駛,再到工業領域的流水線機器人、物流領域的分揀機器人、醫療領域的手術機器人,都可以看作是具身智能的子集,這也間接反映出了這一領域對存儲產品的需求之大和市場天花板之高。
基于助力多模態大模型、AI智能體的持續進化,曙光存儲已經為人形機器人的發展做出了貢獻——智元機器人作為具身智能的明星企業,近期發布了多款商用人形機器人新品,而在智元機器人快速迭代的背后,除了算力與算法平臺的支撐,更少不了曙光存儲提供的智存產品——ParaStor分布式全閃存儲,實現數據存儲管理與算力系統的高度匹配,加速了機器人的智能開發。
曙光存儲在具身智能領域的道路,其實才剛剛開始。
03
何為最佳存力實踐?
在文章的第一部分,我們曾經談到,具身智能領域的存儲增量需求天花板很高,但行業整體仍處于早期階段,這更為前置部署最佳存力實踐提供了良好的空間。
更具體的說,最佳存力實踐是一個復合型概念,它的大前提是合理的存算比,小前提是極致的存儲性能,充分發揮算力效率,呈現一體兩面的關系。
數據統計顯示,目前大模型算力成本約占整個成本的25%,而數據清洗、預處理等工作,在不算數據存儲硬件的情況下,就已經占到成本的22%。從這個角度看,合理的存算比投入,在大模型時代越來越重要。
即使是一些新建的智算中心,雖然硬件投入龐大,但存儲投資與算力需求不匹配,存算比僅為0.42TB/GFlops,遠低于美國1.11TB/GFlops的標準。其中較有典型性的代表,是美國橡樹嶺國家實驗室,其超算中心Frontier的存算比達11PFlops:7PB,通過分布式存儲架構和高速網絡(10TB/s帶寬)實現了高效調度,充分發揮了整個系統的性能。
存算比的不合理,既有過度追求算力規模導致的投資結構失衡的宏觀問題,也有技術與需求脫節的微觀問題,它并非朝夕可以改變,而是必須通過長期的、優秀的產業實踐,用實實在在的結果來改變人們的觀念。
當然,問題的另一面是,要達到合理的存算比,并非一味依賴增加存儲的投資就可以解決,更具體也更重要的是,必須精心選擇高性能、且能有助于發揮整個AI基礎設施整體能力的存儲產品,才是上佳之道。
現在,盡人皆知的是AI算力芯片昂貴、缺貨、一卡難求,但相對少人知道的是,即使芯片性能受限,如果與先進的存儲子系統搭配,同樣可以達到甚至超越預期的性能。
例如,在曙光存儲的集中式存儲設備中,通過建立無鎖化的數據IO“超級隧道”,可以實現推理時延降低80%;在分布式全閃存儲中,通過“超級隧道”的理念延伸,依靠“五級加速”和“三級協同”,能夠實現4倍提升AI訓練速度,賦予AI極致性能體驗;應用前述的190GB/s+500萬IOPS的分布式存儲設備,能夠把模型訓練的迭代頻次從“月”提升到“周”。
更值得注意的是,追求高性能也并非一味求貴求好,反而應該追求的是“適宜”,特別是目前中國具身智能智能行業的主體大部分是創業公司,在激烈的競爭中,這些創業公司的生存之道,是要考慮怎么樣去善用每一塊錢,而不是堆砌更多昂貴的硬件來拉低性價比。
曙光存儲就提供了這種務實的選擇,如分布式存儲ParaStor S6000,采取了閃存盤和機械硬盤結合的混閃架構,實現1.44PB/框存儲密度,通過冷熱數據智能分層,在整個模型訓練生命周期中有效降低20%存儲成本,但并不以性能的損失為代價。
事實上,不只在具身智能領域,更廣泛的共識是——建立先進的AI基礎設施,已經是國運之爭。
而在地緣政治矛盾加劇的背景下,中國擁有全棧自主AI體系的重要性不言而喻,而在這種壓力和競爭格局中,中國如果有幾家如曙光存儲這樣能夠進行底層技術創新并取得世界級成果的存儲企業,是中國AI發展的幸事。
但在具體層面,在很長一段時間里,數據爆炸將繼續擴展,將對存儲上限不斷的提出挑戰,曙光也必須不斷的技術創新來滿足新的需求,存儲行業將面臨一個快速發展期,而對核心技術的掌握是決定意義的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.