過往運算基本上就是CPU一言堂,那時的霸主是Intel;挖礦初期,AMD的GCN小核心架構成為時代紅利,后續nVidia的CUDA架構不斷更新,從而成為了從挖礦、專業應用,以及AI運算都成為了霸主。
而Deepseek的出現打破了CUDA算力壟斷。
DeepSeek 通過對算法的優化和對底層計算的抽象,實現了對硬件的無關性。這意味著它不僅可以在英偉達的 GPU 上運行,還能在 AMD 的 GPU、華為的芯片甚至蘋果的 M 系列芯片等多種硬件平臺上施展才華,為不同硬件廠商提供了新的發展機遇,打破了 NVIDIA 憑借 CUDA 對硬件生態的壟斷。
獲多方支持合作:DeepSeek 的突破吸引了眾多 GPU 廠商的支持。AMD 已將 DeepSeek - V3 模型集成到其 Instinct MI300X GPU 上,且性能超過了 GPT - 4;華為昇騰也成功適配部署了 DeepSeek 的 AI 模型,加速了其技術的普及和應用。這有助于構建一個更加開放、多元的 GPU 生態體系,使更多硬件廠商能夠在 AI 領域發揮作用,不再完全依賴 NVIDIA 的 CUDA 生態。
當下,深圳市嘉合勁威電子科技有限公司(簡稱“嘉合勁威”)正全力投入研發一款專門針對 AI 專業應用而生的新一代內存,也就是 MRDIMM。這款內存的誕生之意義在于通過對內存容量和性能的顯著提升,以此切實增強 AI 運算的規模與效能,有力地削減中小企業在 AI 研發、運維以及應用環節中所面臨的硬件成本。
回首往昔,服務器和工作站大多依靠 RDIMM 內存來支撐運行。但隨著電腦處理器和顯卡性能如火箭般迅猛飆升,以及 AI 運算能力呈飛速發展態勢,傳統的 RDIMM 內存逐漸顯得捉襟見肘,愈發難以滿足不斷增長的 AI 應用需求。
與此同時,HBM 作為一種嶄露頭角的內存芯片技術,已然發展到了 HBM5 階段。盡管其性能極為出色,然而高昂的成本以及頗高的硬件方案開發要求,致使它更多地被運用在體積更為小巧、更為大型的 AI 應用終端之中。
嘉合勁威當下正專心致志于 MRDIMM 內存的研發工作。這款內存產品能夠廣泛地應用于服務器和工作站,不但可以大幅提升 AI 運行的效能,還能夠有效地降低中小企業在 AI 開發、運維和應用方面的成本。MRDIMM 內存的核心組成部分涵蓋了多路復用寄存時鐘驅動器(MRCD)和多路復用數據緩沖器(MDB)。其獨具特色的并行傳輸設計讓數據吞吐量達成翻倍之效,同時操作兩個內存陣列(Rank),再結合多路復用技術,將數據傳輸速率提升至標準 DDR5 RDIMM 的兩倍之多。
MRDIMM 內存的優勢清晰明了。它完全與現有 DDR5 RDIMM 的物理接口和外形規格相兼容,用戶無需對服務器主板進行任何修改就能夠輕松實現升級;此外,MRDIMM 采用雙等級操作設計,達成了帶寬的成倍增加,讓大容量與高性能能夠同時兼顧。在電腦處理器、顯卡和內存這三大對 AI 運算起著關鍵作用的因素里,伴隨著處理器和顯卡性能的提升,內存已然成為制約 AI 運算的瓶頸所在。而 MRDIMM 借助提升帶寬和效率,有效地緩解了這一矛盾沖突。
就以 deepseek 的本地部署應用為例,普通用戶可以選擇 70b 以內的工作模式,在此模式下,對內存容量和帶寬的需求相對而言較為低下。然而,中小企業在選擇 70b 以上的工作模式時,僅僅依靠顯卡顯存顯然難以應對自如,此時內存的容量大小和帶寬便成為了影響運行效能的關鍵要素。選用 MRDIMM 內存,不但能夠降低 deepseek 本地部署應用的電腦配置成本,還能夠在保持配置不變的情形下,通過將內存升級為 MRDIMM,實現 AI 運算能效的大幅提升。
嘉合勁威正在研發的 MRDIMM 內存,單根容量覆蓋 32GB 至 256GB,第一代產品的傳輸速率達到 8,800 MT/s,第二代支持 12,800 MT/s 速率,第三代預計將會突破 17,600 MT/s。依據初步測試結果顯示,使用第一代 MRDIMM 的英特爾至強 6 處理器性能提升高達 33%,AI 推理任務中詞元吞吐量提升 31%,延遲降低 24%。MRDIMM 憑借其大容量、高帶寬、低延遲的特性,與 AI 算力需求的完美融合,極大地降低了 AI 人工智能的硬件成本,未來很有希望逐步成為 AI 服務器和高性能計算的標準配置。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.