芯東西(公眾號(hào):aichip001)
作者 ZeR0
編輯 漠影
芯東西6月17日?qǐng)?bào)道,上個(gè)月,英特爾推出3款全新英特爾至強(qiáng)6系列處理器,特別滿足搭載領(lǐng)先GPU的AI系統(tǒng)的需求。其中英特爾至強(qiáng)6776P處理器將作為主控CPU,被應(yīng)用于英偉達(dá)最新一代AI加速系統(tǒng)DGX B300中。據(jù)英特爾技術(shù)專家介紹,英特爾目前是英偉達(dá)唯一的主控CPU合作伙伴。
這三款新品配備性能核(P-core),并集成了英特爾創(chuàng)新的Priority Core Turbo(PCT)以及英特爾Speed Select – 睿頻頻率(Intel SST-TF)技術(shù),可提供定制化的CPU核心頻率,進(jìn)而提升GPU在高強(qiáng)度AI工作負(fù)載下的性能。針對(duì)這些技術(shù)細(xì)節(jié),英特爾技術(shù)專家與芯東西等媒體進(jìn)行了深入交流。
三款新品的一大技術(shù)亮點(diǎn)是通過PCT技術(shù)實(shí)現(xiàn)頻率提升。PCT能夠動(dòng)態(tài)地讓高優(yōu)先級(jí)核心以更高的睿頻頻率運(yùn)行,而低優(yōu)先級(jí)核心以基礎(chǔ)頻率運(yùn)行,從而實(shí)現(xiàn)CPU資源的優(yōu)化配置。
以至強(qiáng)6776P為例,該處理器有64核,TDP為350W,基礎(chǔ)頻率是2.3GHz,所有核心的睿頻(All Core Turbo)是3.6GHz,最大睿頻(Max Turbo)是3.9GHz,而PCT頻率可以達(dá)到4.6GHz,相比傳統(tǒng)64核SKU的3.9GHz高出0.7GHz。
在PCT SKU推出前,其SKU支持的最高頻率為Max Turbo。Max Turbo是指在假設(shè)一半核心處于活躍狀態(tài),而另一半核心處于休眠狀態(tài)時(shí),活躍的核心能夠運(yùn)行在更高的頻率,主要針對(duì)大核心。在云場(chǎng)景中,由于需要將一個(gè)CPU插槽配置為不同的虛擬機(jī)(VM)并租給不同客戶,因此需要在性能和資源分配之間進(jìn)行平衡,通常會(huì)選擇All Core Turbo模式。
而三款全新至強(qiáng)6 SKU最多支持8個(gè)PCT核心,也就是說,8個(gè)PCT核心可以運(yùn)行到更高頻率上,64核最高可以跑到4.6GHz,72核可以跑到4.4GHz,剩下的核心運(yùn)行在基頻上。
英特爾Speed Select技術(shù)則可針對(duì)單路中的不同核心配置分配不同頻率,使其有不同性能。其中的一個(gè)子技術(shù),將單路中的核心分成兩組,即高優(yōu)組和低優(yōu)組,高優(yōu)組配置為高頻率,低優(yōu)組配置為低頻率。
如果GPU需要相對(duì)高頻率的核心來驅(qū)動(dòng),更快地傳輸GPU的數(shù)據(jù),提高GPU利用率,那么PCT設(shè)計(jì)可以幫助實(shí)現(xiàn),進(jìn)而顯著提高整個(gè)系統(tǒng)的運(yùn)行效率。因此這一功能對(duì)于需要順序或串行處理的AI工作負(fù)載至關(guān)重要。
英偉達(dá)DGX B300使用英特爾至強(qiáng)6776P作為主控CPU,選擇2 DPC(每通道2個(gè)DIMM)配置,如果采用最大容量的DIMM,最多支持8TB的CPU內(nèi)存。下圖是英偉達(dá)DGX B300的示意圖,有2個(gè)CPU、8個(gè)GPU,兩個(gè)GNR-SP的雙路通過UPI互連,每路最多支持8個(gè)PCT核心,客戶可按需選擇8個(gè)、6個(gè)、4個(gè)或2個(gè)。
英特爾技術(shù)專家談道,作為主控CPU,至強(qiáng)6與GPU協(xié)同工作,其系統(tǒng)性能受到多種因素的影響,包括I/O、核心性能、內(nèi)存帶寬和容量、CPU上的預(yù)處理或卸載能力、整體CPU系統(tǒng)的RAS,以及各種硬件的外形設(shè)計(jì)等。
與上一代相比,英特爾至強(qiáng)6性能核處理器優(yōu)化的主要特性包括:
(1)增強(qiáng)的I/O性能:相比上一代至強(qiáng)處理器,PCIe通道數(shù)量增加20%至192個(gè)通道,加速了針對(duì)I/O密集型工作負(fù)載的數(shù)據(jù)傳輸。
(2)高核心數(shù)與高單線程性能:每顆CPU最多集成128個(gè)性能核,確保在密集型AI任務(wù)中實(shí)現(xiàn)有效的工作負(fù)載分配。更高的單線程性能與PCT技術(shù)有關(guān)。
(3)內(nèi)存速度更快:相比標(biāo)準(zhǔn)DDR5-6400,內(nèi)存容量和帶寬更高;在高容量配置下提供更優(yōu)異的內(nèi)存性能,并通過MRDIMM和CXL提供領(lǐng)先的內(nèi)存帶寬。
(4)英特爾高級(jí)矩陣擴(kuò)展(AMX):支持FP16精度運(yùn)算,為AI工作負(fù)載中的數(shù)據(jù)預(yù)處理及關(guān)鍵CPU任務(wù)提供高效支持。市場(chǎng)上已有不少關(guān)于通過英特爾AMX將部分MoE(混合專家)模型中的專家層卸載至至強(qiáng)處理器的案例,這種方式有助于提升端到端的吞吐量,降低TCO。
(5)更高穩(wěn)定性與便于維護(hù):提供豐富RAS支持(RAS即Reliability、Availability、Serviceability,指的是可靠性、可用性和可維護(hù)性),專為最大化正常運(yùn)行時(shí)間(uptime)而設(shè)計(jì),具備更出色的穩(wěn)定性和便捷的維護(hù)特性,可降低將業(yè)務(wù)中斷的可能性。通常I/O連接方案選定后,其帶寬便固定不可更改,RAS特性可減少故障,提高I/O的穩(wěn)定性。
(6)支持不同硬件的形態(tài):支持DC-MHS全球標(biāo)準(zhǔn),面向英偉達(dá)MGX和DGX均有與英偉達(dá)合作的主控CPU設(shè)計(jì)。
企業(yè)正在持續(xù)推進(jìn)基礎(chǔ)設(shè)施升級(jí),以適應(yīng)日益增長(zhǎng)的AI需求。在此背景下,英特爾至強(qiáng)6性能核處理器的這些特性,使其進(jìn)一步鞏固了英特爾針對(duì)AI優(yōu)化的CPU解決方案的領(lǐng)先優(yōu)勢(shì),能夠更充分地滿足日益增長(zhǎng)的AI模型和數(shù)據(jù)集的需求。
英特爾技術(shù)專家稱,英特爾始終秉持開放態(tài)度,為主控CPU提供最佳選擇,以滿足客戶的多樣化需求。未來英特爾將持續(xù)關(guān)注市場(chǎng)反饋,以判斷是否需要推出更多集成PCT的SKU。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.