文|李薇
編輯|宋辰
近一個多月來,浪潮信息存儲產品線的一支小分隊多次造訪國內一所專注前沿科學和高新技術研究的高校,與院方老師展開交流,試圖解決他們在科研中遇到的痛點。
他們要知道客戶業務的全過程是什么樣的,要知道整個數據作業流程是怎樣的,然后再看IT的技術架構是什么,對存儲的功能要求是什么。
這正是每一次“跑客戶”的意義,也是浪潮信息存儲產品線整個團隊的日常:他們必須時刻保持和客戶的頻繁溝通,每一個項目,從客戶有訴求到最終交付產品,至少需要和客戶互動十幾次,才能在“實戰”下收獲口碑——
上海交通大學2024年3月正式上線的科學大數據平臺,融入了浪潮信息存儲的科學計算解決方案,極大提高了科研團隊的效率。以前復制幾十個T數據集需要一周的時間,借助科學大數據平臺,現在僅僅需要三個小時。
清華大學在全球范圍首次捕捉到“清醒小鼠全腦皮層亞細胞的動態活體觀測圖像”,背后是對數據存儲提出的精細化、實時性及數據零遺失的新挑戰,而能達成這一目標,離不開清華大學使用了浪潮信息基于13000系列的存儲解決方案。
當產業進入AIGC時代,每個團隊更不能懈怠。這個時代,數據不再只是信息的積累,而是關鍵的生產要素,成為推動業務創新與提升生產力的重要引擎;存儲不僅是數據的載體,更是數據與AI深度融合的重要橋梁。
數據是人工智能時代的核心引擎,數據中心逐漸由以計算為中心向以數據為中心轉變。隨著人工智能從“以模型為中心”加速轉向“以數據為中心”,高質量數據的全生命周期管理成為人工智能發展的核心動力之一。
AIGC時代,人工智能和數據要素將是數據中心兩大核心工作場景,而AIGC場景下,存儲面臨性能、效率和韌性方面的挑戰。作為中國頭部企業級存儲企業,浪潮信息存儲將如何應對挑戰?
大咖科技
Tech Chic
打造先進存力,
需要先進架構
從距今3萬年的史前洞穴壁畫,到3000年前泥板楔形文字和甲骨文,到由竹簡、羊皮紙記錄文字,再到磁帶、硬盤、云等介質。人類一直在探索和發明更好用、更便捷的存儲方式。伴隨人類文明的進化,存儲邁入人工智能時代。
ChatGPT發布后,全球范圍內十萬卡算力集群層出不窮,模型參數增長到數千億甚至達到萬億級別;同時,數據處理的復雜度和數據膨脹率也呈指數級激增;數據作為核心基礎,其質量和處理效率將尤為關鍵。這些都給存儲提出了新的命題。
人工智能對存儲帶來的挑戰表現在:多樣多類型數據的快速歸集、海量EB(艾字節)數據的混合負載、高維向量數據的組織形式和數據的全命周期管理。
此外,可信數據空間作為數據要素的資源中心,提供從數據匯集到數據使用及面向行業的數據服務,對數據存儲的數據跨域管理、高效流通共享、數據安全存放和調用、采用節能技術來降低PUE(電源使用效率)等提出了更大的挑戰。
一直以來,數據中心作為信息存儲、處理和分發的核心基礎設施,扮演著不可或缺的角色。過去很長一段時間,云計算在影響和改變著數據中心;另一條線則是科學計算;最近這兩年,又有發展迅猛的人工智能計算。
但無論是云計算、科學計算抑或人工智能計算,在應用端都有一個明顯的趨勢——那就是計算模式的融合。可以預見,未來的數據中心,應該是能夠承載云計算、科學計算、人工智能計算、大數據計算的復合負載。
這樣的趨勢讓存力面臨六大挑戰:數據多樣、混合負載、存算協同、安全可信、全局管理和綠色節能。尤其隨著海量數據的增長,對存儲提出了更高的需求,先進存力成為了存力的重要發展方向。
那么,什么樣的存力是先進的?
對此,浪潮信息存儲首席架構師孫斌總結,先進存力應是以數據為核心,滿足數據全流程、全狀態、全生命周期的多維能力,可實現數據的高效處理、容納、協同、安全、流通和綠色六類特性需求。此外,先進存力需要先進架構。
在融合趨勢加快的背景下,浪潮信息提出了新型存儲架構,并創新提出基于新型存儲架構的機柜級存儲底座(Bottom of Rack,BoR)和數據中心級存儲底座(Bottom of Data center,BOD),以存儲架構創新打造先進存力,滿足集約高效、一體化數據中心的建設要求。
孫斌透露,新型存儲架構并不是從零開始的架構,而是一種架構的重構和架構的革新,是在現有的分布式架構和兼容式架構之上,以分布式架構為基礎,融合集中式架構高性能、高可用、高可靠的優點后,結合人工智能計算、大數據計算對存儲新的需求和技術后做的一個新架構。
雖然有一個過程,但浪潮信息的存儲產品將逐漸地演進新架構,將現有的產品用新架構替代,最終的理想狀態是,只有這樣一套架構。預計2025年3月份,浪潮信息將發布基于新架構的新一代分布式存儲產品。
大咖科技
Tech Chic
AIGC時代,
也是存力的春天
“ChatGPT每天的訪問量達到10億次”“特斯拉已有700萬輛汽車在路上”“百度文小言累計調用量已超35億次”“阿里通義千問實現了1000萬字長文本”“全球首例遠程單臂單孔機器人手術成功完成”……
人工智能時代,科技飛速發展正改變著我們的生活。這背后,算力、存力和運力“三駕馬車”支撐著網絡世界的運轉。
算力指的是計算能力,它是數字時代的核心驅動力之一,尤其隨著人工智能、大數據等技術的不斷進步,算力的需求呈現出爆炸式增長;
存力即數據存儲能力,強大的存力不僅可以保證數據的安全性和可靠性,還能夠為數據分析和挖掘提供堅實的基礎;
運力則是信息傳遞的關鍵,只有具備強大的運力,我們才能享受到流暢的視頻通話、即時的在線服務和無縫的物聯網應用。
過去兩年,在人工智能大火之際,全球算力市場熱鬧非凡,科技巨頭都在爭搶GPU以期獲得更多算力,全球科技界陷入一場算力爭奪戰。而相比算力市場的火爆,存力則默默地低調增長。
數據顯示,2024年前三季度,全球存儲市場規模累計達1202億美元,同比增長96.8%。中國算力市場亦迎來大幅增長,預計2025年上游產業鏈產值將超過2600億元,中下游產值則超過8000億元。
IDC報告指出,2024年第一季度中國存儲市場銷售額保持增長,銷售額11.2億美元,同比增長5.7%,出貨量39512套。其中浪潮信息存儲銷售額以11.4%的占比居中國第二,同比增長13.6%,在頭部廠商中位列第一。
據IDC分析,智能制造、智慧醫療、AIGC等新興應用的爆發式增長及數字經濟高質量發展的政策紅利,為分布式存儲市場帶來前所未有的發展機遇。
以AIGC為例,“百模大戰”掀起新一輪的算力存力競賽,推動融合架構、全閃存、CXL、QLC等新技術的普及應用,加速存儲與AI的深度融合??梢灶A見,AIGC將成為驅動存儲市場快速增長的重要引擎。
孫斌從技術層面解釋了存力在AIGC時代將迎來新一輪快速發展:“都說大模型算力越大越好,但這也要建立在數據的基礎上,數據則離不開存儲里面的數據IO和持久化存儲。”
上世紀60年代,IBM計算機架構師吉恩·阿姆達爾提出過一個關于計算要做好平衡設計的定律,可以理解為算力、存力和運力的比例關系大概為1:1:1。
谷歌在去年發表的一篇論文中指出,過去20年谷歌算力增長了1000倍,但存力并未取得同步的增長,這意味著存力即便朝著百倍的增長,也將會是一次跨越式的增長。
存力怎么做到增長?很重要的手段是,存力怎么跟運力協同,怎么跟算力協同。存力與算力的協同可以通過以存代算和以存強算來實現。
孫斌進一步解釋:“很多計算沒有必要讓GPU再算一遍,只需要做增量計算就好,我們提出用KV Cache(鍵值緩存),存下來代算;以存強算,就意味著讓CPU和GPU等待的時間越短越好,可以大大減少能耗?!?/p>
如今,從交通出行到教育研究,從醫療服務到金融分析,從智能家居到市政建設,人工智能已經滲透到各個領域。
在這些應用端的刺激下,大算力時代拉開序幕,先進存力也將不斷演進,時代的滾滾車輪正在存算協同的軌道上奮勇向前。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.