在這場“抄襲門”大曝料中,提到了一個問題,核心原因就是“算力資源嚴重不足”,曾經他們都說自己的AI芯片性能已經媲美NVIDIA的AI芯片了,如今卻又說“算力資源嚴重不足”,這無疑揭示了他們的AI芯片性能其實與NVIDIA差距甚大。
一直以來,國產AI芯片都強調他們的AI芯片性能已接近NVIDIA的頂級AI芯片,他們拿出了許多參數來證明,然而參數有時候并不可靠,芯片的性能表現得在實際使用中才能證明他們的真實性能。
2024年在智算融合創新發展論壇上,就有業內人士指出,由于優化、軟件配合等方面的因素影響,國產AI芯片的實際表現遠未達到預期,大約只是原預期的大約10%左右,與參數存在巨大的差距。
事實上即使是擁有先進架構設計的NVIDIA也不得不尋求最先進的芯片工藝,以提升性能的同時降低功耗,為此NVIDIA的最新AI芯片已采用了先進的3納米工藝,借此控制AI芯片的發熱問題。
即使如此,NVIDIA的Blackwell架構AI芯片在配置72顆處理器的服務器中,仍然出現過熱問題,為此NVIDIA和它的客戶不得不修改機架設計,控制芯片性能,避免發熱太嚴重導致損壞硬件的后果。
相比之下,國產AI芯片大多還在用7納米工藝,7你們工藝的功耗遠比3納米高得多,嚴重的發熱問題,會進一步阻礙國產AI芯片提升性能,他們的性能很可能與標稱參數存在巨大的差距。
上述提到的NVIDIA用了先進的3納米工藝和更先進的芯片架構之后,仍然無法搭載過多的AI芯片核心,證明了散熱已成為AI芯片提升性能的重要障礙;相比之下,國產AI芯片在采用了更落后的7納米工藝之后,試圖用芯片堆疊的方式提升芯片性能,如何解決散熱問題?
事實上,多芯片堆疊的另一個問題則是AI芯片之間的物理距離還會影響到芯片性能,這從NVIDIA為了縮減AI芯片和存儲芯片的物理距離等,而將AI芯片和HBM存儲芯片封裝在一起,進而提升芯片整體性能可以看出來,如此情況下,芯片堆疊導致的物理距離也會影響著芯片性能。
此前還曾傳出,NVIDIA因為眾所周知的原因無法對中國企業出售先進的AI芯片,而不得不持續閹割AI芯片的性能,以滿足相關的要求,推出的H20芯片閹割了八成的性能,但是仍然受到中國AI企業的追捧,這似乎也反映出國內企業更認可NVIDIA的AI芯片性能,而對國產AI芯片持保留態度。
這種種問題,都證明了國產AI芯片的實際性能與NVIDIA存在不小的差距,只是因為種種原因而未為公眾所知,直到這次的抄襲門,再次讓業界關注到了國產AI芯片性能,那么國產AI芯片的實際性能表現到底是如何的呢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.