有這樣一家公司,它“古老”到可以追溯到80多年前,卻又“年輕”得剛滿上市10周年,這家公司便是專注于電子測試測量領(lǐng)域的是德科技。據(jù)是德科技大中華區(qū)市場總經(jīng)理鄭紀峰介紹,該公司的歷史可以追溯到1939年惠普在車庫里創(chuàng)立的那一年。1999年,惠普分拆成惠普和安捷倫,是德科技則隸屬于安捷倫。2014年,安捷倫和是德科技再次分拆,目前是德科技聚焦于電子通訊、半導(dǎo)體、計算機等細分領(lǐng)域。“按我們財年來算,今年恰巧是是德科技從安捷倫分拆獨立上市的十周年。是德科技從分拆后獨立上市以來推進了諸多工作,深耕電子、通訊、半導(dǎo)體、計算機等領(lǐng)域。”鄭紀峰表示。
圖 | 是德科技大中華區(qū)市場總經(jīng)理鄭紀峰
就在最近,是德科技發(fā)布了一系列端到端解決方案Keysight AI(KAI),旨在幫助用戶通過仿真真實世界的AI工作負載來驗證AI集群組件,從而能夠拓展數(shù)據(jù)中心的AI處理能力。
(來源:資料圖)
對于AI數(shù)據(jù)中心的“運行之痛”,是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅表示:“AI數(shù)據(jù)中心可能需要2-3個月來訓(xùn)練一個模型。它的典型工作狀態(tài)是,每工作幾個小時就得停下來保存一次中間結(jié)果,查看網(wǎng)絡(luò)是否正常,否則之后的工作很可能沒有意義。這是因為在今天的超大型算力中心中,很多器件在已經(jīng)接近物理極限性能的狀態(tài)下運行,整個網(wǎng)絡(luò)中可能存在很多潛在的故障,網(wǎng)絡(luò)的韌性需要提高。”
圖 | 是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅
對于大規(guī)模AI數(shù)據(jù)中心來說,人們通常需要在其設(shè)計過程和構(gòu)建過程中開展全面測試,所有芯片、電纜、互連、交換機、服務(wù)器和圖形處理單元(GPU,Graphics Processing Unit)都需要在組件級和系統(tǒng)級上分別進行驗證。通過使用全棧工作負載來仿真補充物理層測試,可以識別那些在單獨測試組件時無法發(fā)現(xiàn)的漏洞,從而讓用戶更快地提取峰值A(chǔ)I性能,進而更快地增加容量,最終實現(xiàn)AI集群投資回報的最大化。
對于AI提供商、半導(dǎo)體制造商和網(wǎng)絡(luò)設(shè)備制造商來說,KAI系列解決方案能帶來以下功能:
其一,能夠?qū)崿F(xiàn)加速設(shè)計。通過集成的先進的高速數(shù)字設(shè)計仿真驗證工具,對最新的高速外圍組件互連PCIe、高速存儲(DDR、HBM)和池化鏈接(CXL,Compute Express Link)等標準的設(shè)備進行可靠的仿真驗證。
其二,能夠加速開發(fā)。這是因為該方案能夠驗證組件級的合規(guī)性,包括驗證高速互連、電纜和芯片組等,并能在系統(tǒng)級層面驗證工作負載性能。
其三,能夠加速部署和運營。即在整個數(shù)據(jù)中心驗證和優(yōu)化系統(tǒng)級性能,通過使用端到端仿真來在大規(guī)模部署前找出系統(tǒng)中的性能問題,從而降低工作負載失敗的風(fēng)險。
與此同時,該公司還推出了三款新產(chǎn)品:KAI數(shù)據(jù)中心構(gòu)建器、互連與網(wǎng)絡(luò)性能測試儀(INPT-1600GE)、DCA-M采樣示波器。這些產(chǎn)品能夠加速AI網(wǎng)絡(luò)設(shè)計和部署,并能針對1.6T組件進行表征和測試,從而確保AI數(shù)據(jù)中心網(wǎng)絡(luò)實現(xiàn)可靠的良好運行,助力用戶更好地應(yīng)對AI行業(yè)的挑戰(zhàn)。
(來源:資料圖)
KAI數(shù)據(jù)中心構(gòu)建器,主要瞄準交換機廠商和云服務(wù)商。眾所周知,AI服務(wù)提供商需要使用各種并行處理策略來加速AI模型訓(xùn)練,而將模型并行與AI集群拓撲和配置協(xié)同則可以提高訓(xùn)練性能。KAI數(shù)據(jù)中心構(gòu)建器具備工作負載模擬的功能,可以將大模型和其他AI模型訓(xùn)練所需的工作負載,集成到網(wǎng)絡(luò)、主機和加速器等AI基礎(chǔ)設(shè)施組件的設(shè)計和驗證之中,從而能讓硬件設(shè)計、協(xié)議、架構(gòu)和AI訓(xùn)練算法實現(xiàn)更加緊密的協(xié)同。基于KAI數(shù)據(jù)中心構(gòu)建器的工作負載仿真解決方案,能夠再現(xiàn)真實AI訓(xùn)練任務(wù)的網(wǎng)絡(luò)通信模式,從而加速模型訓(xùn)練優(yōu)化所需的學(xué)習(xí)曲線,進而能夠更加深入地洞察性能下降的原因,最終為AI訓(xùn)練任務(wù)過程提供此前難以獲得的能力。
INPT-1600GE,主要瞄準光電模塊廠商以及網(wǎng)絡(luò)芯片與設(shè)備廠商。多年來,在驗證網(wǎng)絡(luò)互連性能的時候,往往需要手動操作,因此會耗費大量時間。原因之一在于場景眾多,自動化程度有限,并且,通常還需要具備高級編程技能的工程師來編寫腳本。對于驗證網(wǎng)絡(luò)互連性能這一過程來說,此前并沒有一個集中的系統(tǒng)來針對互連數(shù)據(jù)和報告進行整理和存儲,所以很難針對測試和配置進行跟蹤和復(fù)制。隨著AI和數(shù)據(jù)中心互連的多樣性以及規(guī)模的不斷增加,針對現(xiàn)今愈加復(fù)雜的AI網(wǎng)絡(luò),使用傳統(tǒng)測試方法很難準確地預(yù)測和衡量其可靠性。而此次發(fā)布的INPT-1600GE搭配了是德科技的互連測試系統(tǒng)(ITS,Interconnect Test System)軟件,這讓該產(chǎn)品可被作為一個整體系統(tǒng),從而能夠智能地組織、存儲和使用數(shù)據(jù),進而實現(xiàn)高速以太網(wǎng)網(wǎng)絡(luò)和AI數(shù)據(jù)中心的互連自動化驗證。
DCA-M采樣示波器,主要瞄準光芯片廠商和光模塊廠商。在AI數(shù)據(jù)中心網(wǎng)絡(luò)的快速部署中,1.6T光互連會帶來較為明顯的測量挑戰(zhàn)。一方面是因為數(shù)據(jù)速率極高,另一方面是因為這類環(huán)境對于信號完整性的要求極其嚴格,工程師必須在較為廣泛的操作條件之下針對收發(fā)器的性能進行表征和驗證,這時就需要精確的測試設(shè)備,即必須使用具備卓越帶寬、低噪聲和高靈敏度的設(shè)備。在相關(guān)制造過程之中,自動化測試必須實現(xiàn)高效、可擴展、高精確等性能,只有這樣才能實現(xiàn)大量關(guān)鍵參數(shù)的驗證,以便能夠確保高吞吐量和產(chǎn)量,以及確保在滿足數(shù)據(jù)中心要求的同時還能符合行業(yè)標準。而此次推出的DCA-M采樣示波器,專為滿足1.6T收發(fā)器光學(xué)測試的嚴格要求而設(shè)計,能夠提供240 Gbps/通道的高速光信號分析,具有高光學(xué)測量靈敏度和集成時鐘恢復(fù)功能,支持高達120 GBaud的數(shù)據(jù)速率,可以滿足數(shù)據(jù)中心AI集群的下一代光互連的研發(fā)需求和制造需求。同時,該產(chǎn)品在測試時使用“采測分離”,即使用一邊采一邊測的并行方式,從而能夠提高測試效率,進而加速客戶的產(chǎn)品推出時間。
談及這一系列產(chǎn)品發(fā)布之前的驗證,“我們與業(yè)界領(lǐng)導(dǎo)者緊密合作,開展了大量工作,還和一些大型云廠商、交換機廠商合作,他們也都使用了我們這套軟件在其實驗室里開展環(huán)境仿真。”李堅補充稱:“在未來五到十年里,AI市場將擁有快速增長的機會,這種增長機會不僅僅來自于算力基礎(chǔ)設(shè)施,可能更多來自于應(yīng)用和服務(wù)。AI的標準還在不斷地演進,是德科技始終與行業(yè)中的合作伙伴攜手合作,在全球范圍內(nèi)共參加了數(shù)十個標準組織,包括以太網(wǎng)聯(lián)盟、PCI-SIG等。我們希望通過合作的方式更好地推進產(chǎn)業(yè)發(fā)展。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.