在臺北國際電腦展上,英特爾正式發布銳炫Pro B系列顯卡,該系列在發布前就已經受到了許多的關注。不過并非因為AI性能,而是傳聞銳炫Pro B系列將以消費級的價格,提供更大的顯存和同級別領先的AI算力,這就足以讓不少個人用戶感到興奮了。
先來看看本次發布的產品規格,銳炫Pro B系列首發共有兩款產品,分別是B50和B60,規格上有著不少區別。其中B50擁有16個Xe核心和128個XMX引擎,峰值算力可達170 TOPS,配備16GB DDR6顯存,顯存帶寬為224GB/s,TDP僅為70W,并且支持PCIe 5.0×8連接,售價僅299美元(人民幣2156元)。
圖源:英特爾
B60則擁有20個Xe核心和160個XMX引擎,峰值算力可達197TOPS,并且配備24GB DDR6顯存,顯存帶寬為456GB/s,主板功耗支持在120~200W之間調整,同樣支持PCIe 5.0 x8接口,售價則是500美元(人民幣3605元)。
圖源:英特爾
對比銳炫Pro A系列,B系列不管是AI性能還是通用性能都有了大幅度的增長,部分性能的漲幅達到130%,徹底彌補了前代性能不足的弊端。而且,與前代專注于AI運算不同,B50的圖形工作性能直接提高了3.4倍,甚至可以滿足更復雜的圖形運算需求。
單從算力性能來看,B50和B60都不算突出,即使是B60也就勉強摸到了RTX 4060的水平,但是消費級顯卡本就因為采用了新的張量核心而在AI算力上具有優勢。比如最新的50系顯卡,即使是最低端的RTX 5060也有614的AI算力,與英偉達的專業計算卡A100差不多,前者價格只要2499元,后者價格則直接跳到五位數。
如果把B50和B60拿去對比英偉達的專業卡,基本可以對標A5000和A4000兩款顯卡,價格分別在10000元和6000元左右,分別是B60的三倍和B50的兩倍多。說實話,即使有英偉達的CUDA生態加持,對于普通用戶和小型企業來說,英特爾依然提供了更具誘惑力和性價比的選擇。
英特爾要掀翻個人AI市場?
自從AI大模型火了之后,本地部署端側模型就成為不少PC愛好者的折騰方向,但是大家很快發現端側部署AI大模型,面臨的最大問題不是算力不足,而是“顯存”不足。很多人覺得AI大模型的端側體驗取決于算力,其實這個看法并不完全正確,對于個人使用的本地AI模型來說,顯存的重要性其實要更高一些。
因為顯存直接決定了你可以運行多大規模的AI大模型,以小雷自己的RTX 4070Ti Super為例,顯存是16GB,那么在確保使用體驗的情況下,最大可以部署32B參數量的模型,與滿血版的DeepSeek有著接近20倍的參數量差距,基本上體驗是大打折扣的。
簡單來說,即使顯卡的AI算力爆表,如果顯存不足以運行大參數量的AI大模型,那么最終的體驗都不會好,因為AI算力只能決定生成token的速度,也就是回復你的用時更短,而模型參數量則直接決定回答的質量和準確性。
反之,如果你有足夠的顯存去部署大參數量的AI模型,那么即使算力性能一般,無非就是生成回答的速度慢一些,個人使用的話忍忍也就過去了。如今的個人AI市場基本上處于“算力誠可貴,顯存價更高”的狀態,畢竟單看算力的話RTX 5090幾乎是A100 80G版的兩倍,前者售價三萬就已經被不少人吐槽了,后者價格卻接近十八萬。
圖源:淘寶
所以,顯存的重要性應該不用小雷再過多敘述了吧?對于普通用戶來說,花十幾萬買一張專業卡顯然是不劃算的,但是消費級顯卡在互聯協議上的閹割,讓用戶無法通過多卡串聯來拓展顯存,也就讓端側部署AI的體驗變得十分尷尬。
為了解決顯存問題,甚至出現了改裝顯存的RTX 2080Ti 22G版(原版為11G),因為其支持完全版本的NVLink,可以實現顯存共享,按單位顯存成本和算力來看,算是個人AI服務器里性價比最高的選擇之一。
但是,在英特爾的B50和B60面世后,這些經過改裝的RTX 2080Ti 22G版估計就要失業了,畢竟2080Ti本身的算力也就130TOPS,而且改裝的顯存存在不穩定等隱患。作為對比,擁有24G顯存和197TOPS算力的B60只要3600+,而且支持PCIe 5.0協議下的8卡互聯,推理和訓練速度都遠超老方案。
圖源:英特爾
對于普通用戶來說,只需要不到一萬的成本,就可以得到一臺能夠部署中等參數規模AI大模型的PC,在8卡互聯的情況下,196GB的顯存甚至可以勉強滿足1.58-bit 量化版的滿血DeepSeek本地部署,顯卡成本也就不到三萬(服務器主板等另算)。
可以說,B50和B60對于個人AI愛好者而言,無疑是真正的“性價比之選”,如果不考慮模型訓練效率等問題,它可以輕松讓你在家里搭建一個小型AI服務器。
生存壓力下,英特爾另辟蹊徑
前段時間,英特爾公布了第一季度財報,報告顯示,英特爾第一財季營收為127億美元(約合人民幣916億元),與上年同期的127億美元相比持平;應占凈虧損為8億美元(約合人民幣57億元),與上年同期的應占凈虧損4億美元(約合人民幣29億元)相比擴大115%
可以說生成的壓力迫使英特爾加速業務的推進,并且尋找更多的利潤增長點。不過,雖然英特爾的B50和B60兩款消費級AI顯卡都有著不錯的性價比,與英偉達的差距仍然沒有縮小多少,巨頭的訂單仍然會像雪片一樣涌向英偉達而不是英特爾。
無他,對于大型企業來說,價格并非關鍵,算力效率才是關鍵,因為這決定了他們能否更早完成AI訓練,在下一輪AI競賽中領先對手。
所以,英特爾顯然不打算與英偉達爭奪大型企業用戶,而是瞄準了小型企業和個人市場。就像我前面說的那樣,對于個人用戶來說,銳炫Pro B系列顯卡確實是不錯的選擇,對于小型工作室和企業而言也是如此。
圖源:英特爾
試想一下,花上十來萬你就可以部署一個擁有數百G顯存,理論上支持部署主流大型AI模型的服務器,這將比以往所有同級別的AI服務器方案都便宜得多(目前的主流方案一般需要數百萬的成本)。
換言之,英特爾直接把小型企業的AI轉型門檻抹去了大半,僅留下了“技術問題”,畢竟熟悉AI領域的人才如今都是香饃饃,想招到人手并不容易。當高昂的硬件成本不復存在,那么還有什么理由不去嘗試著擁抱一下AI呢?
雖然小型企業的單個采購份額遠不能和大型企業相比,但是從市場角度來說,小型企業的數量也是非常可觀。而且英特爾可以與各種服務器供應商如浪潮、聯想等合作,為企業提供一步到位的AI解決方案,這些基于英特爾AI計算卡設計的方案將因為低廉的硬件成本而更容易被客戶所接受。
可以說,在英偉達忽略的市場里,英特爾正在用自己的方式為顯卡業務找尋新的出路,而且真的有可能成功,對于英特爾來說,這個新的業務已是難得的增長點,必須牢牢把握住。
不過,英特爾可能并非唯一這么想的企業,AMD也在臺北國際電腦展上發布了Radeon AI PRO R9700,這款AI計算卡基于消費級核心打造,擁有32GB的顯存并最高支持四卡串聯,雖然上限與英特爾有所差距,但是也有著更強的算力。
此外,還有諸如Arm等半導體企業,也對消費級的AI市場“虎視眈眈”,Arm去年就已經宣布與眾多合作伙伴一起推動Arm架構的AI芯片生態發展與研發,同時開發屬于自己的AI芯片。這些產品不僅面向服務器市場,也將面向消費級市場,依賴Arm架構的出色能效比,或許有一天我們可以實現小型設備上的大規模AI模型部署也說不定。
AI的浪潮里,科技企業不進則退,對于已經深陷漩渦之中的半導體企業來說更是如此,誰能抓住機遇跨入下一階段,誰就能夠在未來領導這個行業。
5月20日-5月23日,25年臺北國際電腦展在中國·臺北舉辦。
作為全球領先的 AIoT 和新創產業大展,今年主題為AI Next。
歡迎與雷科技一起關注臺北電腦展上的AI PC、AI 芯片、AI硬件,一起感受撲面而來的AI狂潮。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.