聯(lián)想服務(wù)器全新升級三大家族領(lǐng)跑后訓(xùn)練時(shí)代

2025-05-20 20:59:16　來源: 驅(qū)動(dòng)中國

北京舉報(bào)

分享至

如果說ChatGPT的發(fā)布為生成式AI開啟了一扇探索之窗，那么DeepSeek的橫空出世則推開了通往這片新大陸的機(jī)遇之門。DeepSeek通過突破性的稀疏化架構(gòu)設(shè)計(jì)與開源生態(tài)戰(zhàn)略，將大模型研發(fā)成本降低80%以上，加速了“AI平權(quán)”，也標(biāo)志著AI正式邁入后訓(xùn)練時(shí)代。與此同時(shí)，算力基礎(chǔ)設(shè)施迎來了關(guān)鍵進(jìn)化節(jié)點(diǎn)。

作為一家擁有33年服務(wù)器研發(fā)歷史的企業(yè)，聯(lián)想一直在堅(jiān)持不懈地引領(lǐng)著服務(wù)器的技術(shù)創(chuàng)新，為客戶業(yè)務(wù)應(yīng)用不斷重新定義新的算力。

早在幾年前，聯(lián)想就提出了高性能、高可靠、高可擴(kuò)展、低能耗（“三高一低”）的服務(wù)器設(shè)計(jì)理念。如今，隨著AI應(yīng)用進(jìn)入百花齊放的后訓(xùn)練時(shí)代，聯(lián)想對“三高一低”的設(shè)計(jì)理念進(jìn)一步演進(jìn)，提出打造“更強(qiáng)大、更穩(wěn)定、更高效、更綠色”的算力基礎(chǔ)設(shè)施，并針對業(yè)務(wù)數(shù)據(jù)到智能業(yè)務(wù)全過程的三個(gè)關(guān)鍵應(yīng)用場景——數(shù)據(jù)處理、模型訓(xùn)練和推理應(yīng)用分別進(jìn)行優(yōu)化，形成數(shù)據(jù)處理算力服務(wù)器、AI訓(xùn)練算力服務(wù)器、推理應(yīng)用算力服務(wù)器三大家族。

在日前舉行的聯(lián)想創(chuàng)新科技大會(huì)上，聯(lián)想對三大服務(wù)器產(chǎn)品家族全線升級，并推出了一系列服務(wù)器新品，以幫助企業(yè)構(gòu)建更強(qiáng)大、更高效、更穩(wěn)定、更綠色的混合式基礎(chǔ)設(shè)施，助力人工智能的快速落地。這些產(chǎn)品包括：

· 數(shù)據(jù)處理算力服務(wù)器聯(lián)想ThinkSystemSC750 V4

· AI訓(xùn)練算力服務(wù)器聯(lián)想問天WA7880a家族

· 推理應(yīng)用算力服務(wù)器聯(lián)想問天 WA5480 G5、WR5220 G5、聯(lián)想ThinkSystemSR650 V4、SR650a V4、SR630 V4

這些服務(wù)器新品都采用了英特爾最新一代處理器——英特爾?至強(qiáng)?6，與上一代處理器相比，配備更多內(nèi)核和更快內(nèi)存，每個(gè)內(nèi)核均內(nèi)置 Al加速功能，性能更上一層樓。同時(shí)，它們分別面向不同的AI應(yīng)用場景進(jìn)行了針對性優(yōu)化，以充分釋放這些服務(wù)器的算力潛能。

聯(lián)想數(shù)據(jù)處理算力服務(wù)器家族：高密度架構(gòu)提升數(shù)據(jù)處理效率

數(shù)據(jù)預(yù)處理是人工智能應(yīng)用的第一步。在此階段需要利用服務(wù)器對業(yè)務(wù)數(shù)據(jù)和公共數(shù)據(jù)進(jìn)行加工和處理，這不僅要求服務(wù)器具有強(qiáng)大的性能，還要保證算力穩(wěn)定可靠，同時(shí)服務(wù)器還要有較高的數(shù)據(jù)帶寬，以保障數(shù)據(jù)高速傳輸。

聯(lián)想數(shù)據(jù)處理算力服務(wù)器系列在單一機(jī)柜中能夠?qū)崿F(xiàn)高達(dá)48個(gè)計(jì)算節(jié)點(diǎn)，可配置12288個(gè)英特爾?至強(qiáng)?6性能核心，再結(jié)合8800MHz的MRDIMM，可以極大地提升生成式人工智能的性能。

隨著機(jī)柜內(nèi)節(jié)點(diǎn)數(shù)量的增加和處理器核心數(shù)量的不斷攀升，散熱問題開始凸顯，從風(fēng)冷轉(zhuǎn)向液冷成為必然。聯(lián)想采用專利的無滴漏不銹鋼盲配機(jī)制，使用航空級防滴連接器與計(jì)算托盤緊密相連。13U16節(jié)點(diǎn)的高密度全液冷設(shè)計(jì)，整機(jī)無需風(fēng)扇，既減少高頻振動(dòng)的潛在影響，又有效整合空間效率，而且持續(xù)運(yùn)行在Turbo模式可大幅提升算力效率，節(jié)約40%的數(shù)據(jù)中心能耗。

聯(lián)想AI訓(xùn)練算力服務(wù)器家族：異構(gòu)計(jì)算與智能調(diào)度驅(qū)動(dòng)千億模型

模型訓(xùn)練通常需要借助多GPU卡來完成以支持千億級參數(shù)規(guī)模模型訓(xùn)練，因此AI訓(xùn)練服務(wù)器必須支持GPU+CPU的異構(gòu)計(jì)算組合，以及解決多GPU卡部署帶來的制冷挑戰(zhàn)。

聯(lián)想AI訓(xùn)練算力服務(wù)器配置2顆英特爾?至強(qiáng)?6處理器，8塊GPU通過OAM互聯(lián)，可為模型訓(xùn)練應(yīng)用輸出澎湃算力。而在散熱方面，服務(wù)器支持聯(lián)想冷板式CPU/GPU液冷方案和600W以上處理器浸沒式液冷技術(shù)，為AI訓(xùn)練服務(wù)器家族綠色節(jié)能提供保障。

AI訓(xùn)練服務(wù)器不僅僅是硬件組合，為了將服務(wù)器的性能發(fā)揮到極致，還要有一個(gè)強(qiáng)大的算力調(diào)度平臺(tái)。

聯(lián)想AI訓(xùn)練服務(wù)器還有聯(lián)想萬全異構(gòu)智算平臺(tái) 3.0的加持，借助它不僅可以實(shí)現(xiàn)異構(gòu)的算力調(diào)度，而且還通過異步讀寫訪存優(yōu)化、算子優(yōu)化和計(jì)算路徑優(yōu)化等，降低訓(xùn)練開銷15%以上。實(shí)測結(jié)果顯示，聯(lián)想單臺(tái)8卡 GPU服務(wù)器部署DeepSeek，吞吐量達(dá)到12000tokens/s，整個(gè)記錄目前還在不斷地刷新中。

聯(lián)想推理應(yīng)用算力服務(wù)器：全域覆蓋加速智能決策落地

推理和決策是人工智能應(yīng)用價(jià)值的最終落地。為了滿足推理應(yīng)用的需求，服務(wù)器需要具有通用性，要同時(shí)支持CPU和GPU，還要支持各種內(nèi)存和網(wǎng)卡等。

聯(lián)想推理應(yīng)用算力服務(wù)器系列支持英特爾?至強(qiáng)?6和主流PCIe GPU，每個(gè)CPU內(nèi)核都集成了英特爾AMX BF16和FP16加速器，在推理應(yīng)用中與GPU配合性能天衣無縫，甚至直接調(diào)用CPU算力就能支持小規(guī)模推理業(yè)務(wù)。

在散熱方面，聯(lián)想推理應(yīng)用算力服務(wù)器也支持CPU/GPU/MEM/VR的全液冷方案，結(jié)合英特爾?至強(qiáng)?6能效核優(yōu)異的能耗性能比，能為客戶提供2倍性能、4倍性能功耗比。

作為AI時(shí)代下的弄潮兒，2024年聯(lián)想服務(wù)器在不斷的追求超越，具有與時(shí)俱進(jìn)的產(chǎn)品理念和前瞻性布局。根據(jù)IDC最新季度服務(wù)器跟蹤報(bào)告，2024年實(shí)現(xiàn)了全年180%的最快市場增長。2025年是全球人工智能基礎(chǔ)設(shè)施持續(xù)演進(jìn)的關(guān)鍵之年。聯(lián)想服務(wù)器將始終堅(jiān)持通過技術(shù)創(chuàng)新與生態(tài)共建雙輪驅(qū)動(dòng)，助力行業(yè)客戶突破人工智能規(guī)模化部署的各種技術(shù)瓶頸，矢志不渝地扮演技術(shù)創(chuàng)新與場景落地的核心推動(dòng)力量。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.