如果說ChatGPT的發(fā)布為生成式AI開啟了一扇探索之窗,那么DeepSeek的橫空出世則推開了通往這片新大陸的機(jī)遇之門。DeepSeek通過突破性的稀疏化架構(gòu)設(shè)計(jì)與開源生態(tài)戰(zhàn)略,將大模型研發(fā)成本降低80%以上,加速了“AI平權(quán)”,也標(biāo)志著AI正式邁入后訓(xùn)練時(shí)代。與此同時(shí),算力基礎(chǔ)設(shè)施迎來了關(guān)鍵進(jìn)化節(jié)點(diǎn)。
作為一家擁有33年服務(wù)器研發(fā)歷史的企業(yè),聯(lián)想一直在堅(jiān)持不懈地引領(lǐng)著服務(wù)器的技術(shù)創(chuàng)新,為客戶業(yè)務(wù)應(yīng)用不斷重新定義新的算力。
早在幾年前,聯(lián)想就提出了高性能、高可靠、高可擴(kuò)展、低能耗(“三高一低”)的服務(wù)器設(shè)計(jì)理念。如今,隨著AI應(yīng)用進(jìn)入百花齊放的后訓(xùn)練時(shí)代,聯(lián)想對“三高一低”的設(shè)計(jì)理念進(jìn)一步演進(jìn),提出打造“更強(qiáng)大、更穩(wěn)定、更高效、更綠色”的算力基礎(chǔ)設(shè)施,并針對業(yè)務(wù)數(shù)據(jù)到智能業(yè)務(wù)全過程的三個(gè)關(guān)鍵應(yīng)用場景——數(shù)據(jù)處理、模型訓(xùn)練和推理應(yīng)用分別進(jìn)行優(yōu)化,形成數(shù)據(jù)處理算力服務(wù)器、AI訓(xùn)練算力服務(wù)器、推理應(yīng)用算力服務(wù)器三大家族。
在日前舉行的聯(lián)想創(chuàng)新科技大會(huì)上,聯(lián)想對三大服務(wù)器產(chǎn)品家族全線升級,并推出了一系列服務(wù)器新品,以幫助企業(yè)構(gòu)建更強(qiáng)大、更高效、更穩(wěn)定、更綠色的混合式基礎(chǔ)設(shè)施,助力人工智能的快速落地。這些產(chǎn)品包括:
· 數(shù)據(jù)處理算力服務(wù)器聯(lián)想ThinkSystemSC750 V4
· AI訓(xùn)練算力服務(wù)器聯(lián)想問天WA7880a家族
· 推理應(yīng)用算力服務(wù)器聯(lián)想問天 WA5480 G5、WR5220 G5、聯(lián)想ThinkSystemSR650 V4、SR650a V4、SR630 V4
這些服務(wù)器新品都采用了英特爾最新一代處理器——英特爾?至強(qiáng)?6,與上一代處理器相比,配備更多內(nèi)核和更快內(nèi)存,每個(gè)內(nèi)核均內(nèi)置 Al加速功能,性能更上一層樓。同時(shí),它們分別面向不同的AI應(yīng)用場景進(jìn)行了針對性優(yōu)化,以充分釋放這些服務(wù)器的算力潛能。
聯(lián)想數(shù)據(jù)處理算力服務(wù)器家族:高密度架構(gòu)提升數(shù)據(jù)處理效率
數(shù)據(jù)預(yù)處理是人工智能應(yīng)用的第一步。在此階段需要利用服務(wù)器對業(yè)務(wù)數(shù)據(jù)和公共數(shù)據(jù)進(jìn)行加工和處理,這不僅要求服務(wù)器具有強(qiáng)大的性能,還要保證算力穩(wěn)定可靠,同時(shí)服務(wù)器還要有較高的數(shù)據(jù)帶寬,以保障數(shù)據(jù)高速傳輸。
聯(lián)想數(shù)據(jù)處理算力服務(wù)器系列在單一機(jī)柜中能夠?qū)崿F(xiàn)高達(dá)48個(gè)計(jì)算節(jié)點(diǎn),可配置12288個(gè)英特爾?至強(qiáng)?6性能核心,再結(jié)合8800MHz的MRDIMM,可以極大地提升生成式人工智能的性能。
隨著機(jī)柜內(nèi)節(jié)點(diǎn)數(shù)量的增加和處理器核心數(shù)量的不斷攀升,散熱問題開始凸顯,從風(fēng)冷轉(zhuǎn)向液冷成為必然。聯(lián)想采用專利的無滴漏不銹鋼盲配機(jī)制,使用航空級防滴連接器與計(jì)算托盤緊密相連。13U16節(jié)點(diǎn)的高密度全液冷設(shè)計(jì),整機(jī)無需風(fēng)扇,既減少高頻振動(dòng)的潛在影響,又有效整合空間效率,而且持續(xù)運(yùn)行在Turbo模式可大幅提升算力效率,節(jié)約40%的數(shù)據(jù)中心能耗。
聯(lián)想AI訓(xùn)練算力服務(wù)器家族:異構(gòu)計(jì)算與智能調(diào)度驅(qū)動(dòng)千億模型
模型訓(xùn)練通常需要借助多GPU卡來完成以支持千億級參數(shù)規(guī)模模型訓(xùn)練,因此AI訓(xùn)練服務(wù)器必須支持GPU+CPU的異構(gòu)計(jì)算組合,以及解決多GPU卡部署帶來的制冷挑戰(zhàn)。
聯(lián)想AI訓(xùn)練算力服務(wù)器配置2顆英特爾?至強(qiáng)?6處理器,8塊GPU通過OAM互聯(lián),可為模型訓(xùn)練應(yīng)用輸出澎湃算力。而在散熱方面,服務(wù)器支持聯(lián)想冷板式CPU/GPU液冷方案和600W以上處理器浸沒式液冷技術(shù),為AI訓(xùn)練服務(wù)器家族綠色節(jié)能提供保障。
AI訓(xùn)練服務(wù)器不僅僅是硬件組合,為了將服務(wù)器的性能發(fā)揮到極致,還要有一個(gè)強(qiáng)大的算力調(diào)度平臺(tái)。
聯(lián)想AI訓(xùn)練服務(wù)器還有聯(lián)想萬全異構(gòu)智算平臺(tái) 3.0的加持,借助它不僅可以實(shí)現(xiàn)異構(gòu)的算力調(diào)度,而且還通過異步讀寫訪存優(yōu)化、算子優(yōu)化和計(jì)算路徑優(yōu)化等,降低訓(xùn)練開銷15%以上。實(shí)測結(jié)果顯示,聯(lián)想單臺(tái)8卡 GPU服務(wù)器部署DeepSeek,吞吐量達(dá)到12000tokens/s,整個(gè)記錄目前還在不斷地刷新中。
聯(lián)想推理應(yīng)用算力服務(wù)器:全域覆蓋加速智能決策落地
推理和決策是人工智能應(yīng)用價(jià)值的最終落地。為了滿足推理應(yīng)用的需求,服務(wù)器需要具有通用性,要同時(shí)支持CPU和GPU,還要支持各種內(nèi)存和網(wǎng)卡等。
聯(lián)想推理應(yīng)用算力服務(wù)器系列支持英特爾?至強(qiáng)?6和主流PCIe GPU,每個(gè)CPU內(nèi)核都集成了英特爾AMX BF16和FP16加速器,在推理應(yīng)用中與GPU配合性能天衣無縫,甚至直接調(diào)用CPU算力就能支持小規(guī)模推理業(yè)務(wù)。
在散熱方面,聯(lián)想推理應(yīng)用算力服務(wù)器也支持CPU/GPU/MEM/VR的全液冷方案,結(jié)合英特爾?至強(qiáng)?6能效核優(yōu)異的能耗性能比,能為客戶提供2倍性能、4倍性能功耗比。
作為AI時(shí)代下的弄潮兒,2024年聯(lián)想服務(wù)器在不斷的追求超越,具有與時(shí)俱進(jìn)的產(chǎn)品理念和前瞻性布局。根據(jù)IDC最新季度服務(wù)器跟蹤報(bào)告,2024年實(shí)現(xiàn)了全年180%的最快市場增長。2025年是全球人工智能基礎(chǔ)設(shè)施持續(xù)演進(jìn)的關(guān)鍵之年。聯(lián)想服務(wù)器將始終堅(jiān)持通過技術(shù)創(chuàng)新與生態(tài)共建雙輪驅(qū)動(dòng),助力行業(yè)客戶突破人工智能規(guī)模化部署的各種技術(shù)瓶頸,矢志不渝地扮演技術(shù)創(chuàng)新與場景落地的核心推動(dòng)力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.