近日在南京舉辦的2025全球閃存峰會上,慧榮科技企業(yè)級儲存事業(yè)部產(chǎn)品行銷應(yīng)用部資深協(xié)理周宗廉先生發(fā)表演講,闡述了在AI浪潮的新時代中,慧榮的企業(yè)級存儲技術(shù)是如何演進的,并在會后接受了快科技的采訪。
雖然如今幾乎人人言必稱AI,但事實上,AI已經(jīng)發(fā)展了幾十年,也經(jīng)歷了翻天覆地的變化。
早在1966年,MIT麻省理工AI實驗室就設(shè)計了第一個聊天機器人ELIZA,代碼只有200行,可以逐字分析人類輸入的內(nèi)容,再重組回復(fù),仿佛和真人聊天。
如今的AI人機交互,背后是幾十上百億參數(shù)的大模型,而且逐漸變得無所不能。
當然,現(xiàn)代AI負載對于硬件性能的要求也是空前的,不僅僅是CPU處理器、GPU加速器,更離不開強大的內(nèi)存與存儲支撐,SSD的快速發(fā)展可以說正逢其時。
慧榮的企業(yè)級存儲解決方案名為MonTitanTM,不是單一芯片,而是包含SSD主控芯片、參考硬件設(shè)計、企業(yè)級固件的平臺化完整方案。
周宗廉先生解釋說,慧榮專注于IC設(shè)計,自己并不生產(chǎn)SSD成品,因此MonTitanTM平臺本質(zhì)上是為客戶提供參考設(shè)計,提供堅實的技術(shù)與設(shè)計基礎(chǔ),使客戶可以更輕松地基于此開發(fā)自己的產(chǎn)品,專注于產(chǎn)品定義和市場推廣。
慧榮MonTitanTM平臺的首款產(chǎn)品是SM8366。
它支持PCIe 5.0、雙端口、NVMe 2.0、OCP 2.5等各種企業(yè)級特性、安全功能,支持最大256TB閃存容量。
順序讀取性能超過14GB/s,隨機性能更是超過350萬IOPS,能在更快的時間內(nèi)完成大型模型或者圖像化神經(jīng)網(wǎng)絡(luò)訓(xùn)練,可以說是真正的企業(yè)級主控。
SM8388是慧榮MonTitanTM平臺的新成員,支持八通道閃存、最大128TB容量、SCA界面,并延續(xù)了SM8366的各種優(yōu)勢。
面向未來,慧榮還準備好了PCIe 6.0 SSD主控方案"SM8466"。
它突破性敵采用臺積電4nm先進制程,支持單個x4或者兩個x2端口,支持最多16個閃存通道和512TB閃存容量,可搭配DDR5-7200規(guī)格的大容量高頻緩存,還支持NVMe 2.0+。
性能方面更是突飛猛進,順序讀取能做到28GB/s甚至是逼近30GB/s,4K隨機性能也翻番到了700萬IOPS。
在接受采訪時,周宗廉先生表示,AI時代對于存儲提出了新的、更苛刻的需求,一是極致性能,就像NVIDIA提出的要求往往非常夸張,二是多租戶保障,這也是CSP云服務(wù)廠商的核心訴求,慧榮的MonTitan?平臺就致力于滿足以這兩方面為代表的各種需求。
SM83366主控在設(shè)計之初,理念就非常清晰,這是一顆面向PCIe 5.0的芯片,因此整個內(nèi)部架構(gòu)設(shè)計的出發(fā)點,就是確保I/O吞吐能力可以匹配PCIe 5.0的高帶寬,必須有能力處理龐大的數(shù)據(jù)流,為此內(nèi)部構(gòu)建了多個專用的高效加速引擎,并做了大量有關(guān)數(shù)據(jù)流控制等方面的優(yōu)化。
同時,慧榮深入研究了市場上現(xiàn)有相關(guān)主控產(chǎn)品的內(nèi)部架構(gòu),并針對性地設(shè)計了相應(yīng)的處理機制,包括如何高效處理來自前端的命令隊列、如何根據(jù)閃存Plane數(shù)量進行并行處理等等,從而確保前端的PCIe 5.0帶寬可以被后端閃存充分利用,避免出現(xiàn)瓶頸。
對于模組廠商等直接客戶,慧榮SM8366的關(guān)鍵價值在于特別優(yōu)化的固件架構(gòu),使其可以更容易、更高效地使用慧榮主控芯片進行產(chǎn)品設(shè)計和量產(chǎn),降低開發(fā)難度和成本。
對于CSP等終端客戶,極致的性能、能效等技術(shù)創(chuàng)新都可以大大提升用戶體驗,尤其是Performance Shaping多租戶性能保障技術(shù),可以從硬件層面精細化地隔離和保障不同租戶獲得相應(yīng)的、有保障的服務(wù)質(zhì)量,比傳統(tǒng)軟件層面的控制更加精準,這是很多CSP非常看重的地方。
不得不說,如今設(shè)計一款優(yōu)秀的PCIe SSD主控是越來越難了,涉及制程、架構(gòu)、固件、算法等多方面的綜合協(xié)調(diào)與平衡,既要強大的性能、豐富的功能,還要控制功耗、發(fā)熱和成本。
周宗廉先生認為,其中的關(guān)鍵點可以分為三個層面:
一是先進制程的選擇。
采用更先進的制程,比如6nm、5nm甚至是4nm,就能顯著降低功耗,因為先進制程的漏電率更低,尤其是高溫下漏電飆升的問題可以得到更好的控制,這對功耗優(yōu)化至關(guān)重要,當然,先進制程的成本是非常高昂的。
二是成本控制方法。
為了平衡高昂的制造成本,慧榮的核心策略是最大化減少設(shè)計迭代和改版次數(shù),這意味著在芯片流片(Tape-out)前,必須進行極其充分和嚴謹?shù)南到y(tǒng)級驗證,所以慧榮在仿真、加速驗證等方面投入了大量資源,力求在早期發(fā)現(xiàn)并解決問題,避免昂貴的流片失敗或改版,這就可以大大節(jié)約整體成本。
三是芯片架構(gòu)設(shè)計。
在主控芯片內(nèi)部,慧榮實現(xiàn)了精細化的功耗管理,比如通過動態(tài)開關(guān)(Power Gating)等技術(shù),根據(jù)不同的工作負載狀態(tài),精準地開啟或關(guān)閉特定的處理引擎,避免不必要的功耗浪費。
總結(jié)來說,打造一顆優(yōu)秀主控的平衡點在于:通過選擇先進制程獲得能效優(yōu)勢;投入巨量資源在前期驗證上,確保一次成功或最少改版,以攤薄高昂的設(shè)計和制造成本;在架構(gòu)設(shè)計上追求高效和智能化功耗管理。
前邊說過,慧榮已經(jīng)拿出了PCIe 6.0 SSD主控設(shè)計方案,存儲行業(yè)預(yù)計PCIe 6.0 SSD今年就有望登場,2026年開始部署,2028年左右進入普及階段。
再下一代的PCIe 7.0標準規(guī)范剛剛也已經(jīng)公布,SSD預(yù)計要到2028年才會出現(xiàn),2029年開始部署。
未來進入PCIe 6.0、PCIe 7.0時代,SSD主控設(shè)計必然進一步復(fù)雜化,挑戰(zhàn)更加嚴峻。
周宗廉先生認為,挑戰(zhàn)主要來自兩方面,一是技術(shù)挑戰(zhàn),PCIe 6.0/7.0本身的技術(shù)復(fù)雜度就是一個巨大挑戰(zhàn),包括信號完整性、速度,這就涉及芯片、系統(tǒng)到PCB設(shè)計的方方面面。
二是非技術(shù)挑戰(zhàn),主要就是成本控制,比如支持PCIe 6.0/7.0的制程需要更加先進,這就會導(dǎo)致設(shè)計和制造成本變得極其高昂。
對此,慧榮的應(yīng)對策略的核心是確保一次成功,最大限度減少設(shè)計迭代,因此需要在芯片流片前進行前所未有的、極其充分和嚴格的系統(tǒng)級驗證,發(fā)現(xiàn)并解決潛在問題。
另外,慧榮在PCIe 5.0主控時代良好的積累,也將是應(yīng)對PCIe 6.0/7.0挑戰(zhàn)中至關(guān)重要的。
周宗廉先生還強調(diào),芯片設(shè)計的成本極高,尤其是在先進制程下,因此慧榮的策略是盡量在可控的成本下,將芯片內(nèi)部的各個引擎做到極致,并通過強大的固件層使,其能靈活適配各種不同的應(yīng)用場景。
慧榮一直都是持續(xù)研究市場需求,結(jié)合內(nèi)部專家的深度討論和外部信息,在確信存在合理且可觀的市場機會時,才會考慮投入相應(yīng)的解決方案。
這就需要在"領(lǐng)先市場半步"和"避免過度冒險"之間找到最好的平衡點,也需要滿足更嚴苛的性能、功耗、集成度要求,確保產(chǎn)品在未來5-10年甚至更長時間內(nèi)保持技術(shù)領(lǐng)先。
比如在PCIe 5.0主控上,慧榮沒有急于搶首發(fā),而是選擇了更成熟的時機,推出穩(wěn)定可靠且的企業(yè)級SM8366和消費級SM2508,結(jié)果在性能、功耗發(fā)熱上都表現(xiàn)十分優(yōu)秀,都得到了市場的廣泛接受。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.