公眾號記得加星標??,第一時間看推送不會錯過。
在GPU領域,長期以來幾乎只看得到英偉達、AMD、英特爾三家巨頭,尤其是英偉達,憑借其強大生態(tài)、技術積累和品牌影響力,牢牢掌控著高端游戲與專業(yè)圖形市場。從RTX 20、30 系列的光線追蹤,到RTX 40 系列的AI加速,無一不是工業(yè)級性能與軟件生態(tài)的綜合體現(xiàn)。
然而,就是在這樣一片巨頭橫行的紅海中,出現(xiàn)了一家初創(chuàng)公司:Bolt Graphics。他們的目標不是花里胡哨地跟風,而是用一塊叫做 Zeus 的新型GPU,直指路徑追蹤的終極可能。有人說這是“挑戰(zhàn)英偉達最強顯卡的”嘗試,那筆者想說,這不僅僅是挑戰(zhàn),更像是“另辟蹊徑”,從不同的維度重新定義“GPU”的未來。
為何路徑追蹤成為突破口
過去十年,游戲畫質(zhì)最大的質(zhì)變來自實時光線追蹤(RT)。在陰影、反射、全局光照等場景中,它讓游戲世界更接近真實。但RT本質(zhì)仍是對可見線路的近似,以局部采樣實現(xiàn)“足夠好”的效果。許多游戲開發(fā)者在燈光設計中犧牲了物理真實性,換來性能與效率。
路徑追蹤(Path Tracing),則是徹底不同的路線。從場景出發(fā),探測出在任意波段傳播的所有光線路徑。即便是煙霧、毛發(fā)、次表面散射,它也能一并涵蓋。其通過精確采樣得到無噪點結果,解決了幾何鋸齒、高頻紋理振鈴、摩爾紋等走樣問題。盡管計算成本高,但輸出效果的細膩度和動態(tài)范圍表現(xiàn),使其向真正物理精確的渲染邁出了重要一步。
對于視覺精度有極端要求的人來說,路徑追蹤是真正的“無妥協(xié)畫質(zhì)”。但它的計算量極其龐大:傳統(tǒng)方式下實時路徑追蹤所需算力,是普通GPU的十數(shù)倍甚至百倍。
路徑追蹤的早期形式源于 Jim Kajiya 1986 年的開創(chuàng)性論文《渲染方程》。這篇 SIGGRAPH 論文堪稱所有渲染研究的源頭 ——Kajiya 正式定義了一個積分方程,涵蓋了現(xiàn)代渲染理論的全部內(nèi)容。該方程整合了光在物體間反射的所有可能路徑及能量貢獻,統(tǒng)一了漫反射、鏡面反射和焦散效應,摒棄了 “光源與幾何分離” 的觀念,提出所有幾何都能反射和發(fā)射能量,由此終結了點光源概念,要求包括光源在內(nèi)的所有幾何都具備物理面積。
通過將材料屬性明確分為漫反射和鏡面反射成分,為開發(fā)高級雙向反射分布函數(shù)(BRDF)描述材料奠定了基礎,同時淘汰了以往的環(huán)境光項。為闡釋其統(tǒng)一渲染理念,Kajiya 實現(xiàn)了一個暴力路徑追蹤器來求解該積分方程。當時他的理念遠超時代,渲染一張 512×512 像素、每像素 40 次采樣的圖像需 20 小時。他還提出了重要性采樣概念,以及如何用層次 k-d 樹加速計算。
1997 年,Eric Veach 在博士論文《穩(wěn)健蒙特卡洛光傳輸模擬方法》中,為圖形行業(yè)提供了大量理論和技術,推動路徑追蹤的實際應用。 metropolis 光傳輸和雙向路徑追蹤技術,讓渲染研究者得以開發(fā)漸進式求解器,通過高效采樣光路實現(xiàn)無噪點結果。再加上通用可編程 GPU 的普及,計算能力大幅提升,加速了相關計算。
如今,路徑追蹤持續(xù)發(fā)展,在多個行業(yè)得到應用。
為了得到電影級畫面,比如4K、60 FPS的路徑追蹤渲染,迪士尼、皮克斯等機構仍然依賴CPU農(nóng)場,以每幀上千小時的渲染時間來換取觀感。這一點,可以從諸多公開資料看到:例如,一部動畫電影中某個城市街區(qū)的場景渲染甚至耗盡了當年64GB的服務器內(nèi)存,折算下來連256個CPU核心也得跑上小時級別。
對此,初創(chuàng)公司Bolt的做法是:“我們就做那個終極路徑追蹤GPU”。而不是在現(xiàn)有架構基礎上打補丁。他們放棄傳統(tǒng)光柵化圖形流水線,選擇從芯片底層出發(fā),定制一整條路徑追蹤算力通道。
一家專注于光追技術的公司
據(jù)了解,Bolt成立背景比較低調(diào),其團隊以來自圖形、渲染、計算架構領域的工程師為主,大多來自英偉達、AMD、Intel,以及電影制作公司背景。這些工程師意識到盡管光追技術火了,但路徑追蹤的“極致潛力”仍未被觸及。
他們自稱的使命是“重新設計GPU,為架構師、玩家、藝術家和研究人員提供改變世界的工具”。這個定義非常宏大,也非常清晰:目標清晰、定位極端——高性能路徑追蹤、可視化與HPC兼容性。
目前Bolt公布了三種計劃中的Zeus版本,分別是“單芯片” Zeus 1c,TDP 約 120W,基于 RISC-V 自定義亂序標量 + 向量單元,采用小容量高速 LPDDR5X + 大容量 DDR5。路徑追蹤性能約 77 億射線/秒,支持 INT8、INT16、AV1 等加速功能,核心設計以高密度路徑追蹤加速單元為主,不做張量計算。
而“雙芯粒” Zeus 2c則集成兩顆計算和兩顆 IO 芯粒,芯粒間帶寬高達 768GB/s,功耗翻倍性能翻倍,更適合專業(yè)工作站,LPDDR5X 焊死,DDR5 可定制,適度下放給中小型預算客戶。
最貴的是“四芯粒” Zeus 4c(數(shù)據(jù)中心版本),其TDP來到了500W,內(nèi)含 2TB DDR5 + 256GB LPDDR5X,其設計為 2U 服務器卡,一機可配四塊組成集群,支持 NVMe、400Gb/800Gb 以太網(wǎng)、Redfish BMC 級監(jiān)控;旨在構建可擴展路徑追蹤與 HPC 集群平臺。
目前Bolt主要可能會在三個方向進行發(fā)展:專業(yè)工作站市場,對FP64、單精度算力和圖形精度都有要求,Bolt 可以與英偉達 RTX A6000、Blackwell 工作站版競爭;在數(shù)據(jù)中心租賃市場:4c Zeus 配上 800G 網(wǎng)絡和 180TB 內(nèi)存集群,可用于渲染農(nóng)場、數(shù)字孿生平臺、雷達仿真等;而在消費級游戲市場,如果Bolt未來推出低功耗單芯片卡,也有可能配合 DirectX/Vulkan 而進入游戲市場。
Zeus,有何優(yōu)勢?
關于Zeus這三款產(chǎn)品,最令人矚目的無疑是它們的內(nèi)存架構。傳統(tǒng)GPU習慣用 GDDR,為帶寬犧牲容量。而Bolt選擇 LPDDR5X(帶寬) + DDR5(容量),后續(xù)還要支持堆棧 SRAM、共封裝光學芯片。一個 Zeus 4c 卡的總內(nèi)存將直逼 2.25TB,遠超消費級顯卡。這不僅有利于路徑追蹤數(shù)據(jù)集場景,且對 HPC 數(shù)據(jù)集非常友好。
而在接口上,這張卡也面面俱到:雙 PCIe 5.0 x16,400G Ethernet,未來支持 800G——明顯瞄準數(shù)據(jù)中心通信需求。這意味著它不是一塊面向普通消費市場的顯卡,而是從一開始,就定位在專業(yè)工作站甚至服務器機柜級集群領域。
Bolt 宣稱,一套典型 4K 路徑追蹤場景(20 次反射、30 FPS)下,英偉達 RTX 5090 需要 280 張卡,而Zeus僅需28 張卡就能完成。這意味著效能提升了整整 10 倍。功耗方面,更是以驚人的 1/10 全面碾壓傳統(tǒng) GPU。
其提供的數(shù)據(jù)源顯示:RTX 5090 在 4K 120 FPS 狀態(tài)下每像素支持8條光線;Bolt 的 1c卡支持“25 條以上”,2c版可上到“100 條”。這意味著它們在單位時間內(nèi)處理路徑追蹤的密度,比英偉達現(xiàn)實用途 GPU 強上 4–12 倍。
不過需要注意的是,目前Bolt測試依靠模擬器、仿真環(huán)境,而非實卡驗證,但從整體方向與趨勢來看,Bolt的架構似乎已經(jīng)具備真實跑通路徑追蹤的能力。
除了圖形渲染外,Zeus 在 HPC 領域也宣稱提供顯著加速。FP64 是 HPC 的核心,而英偉達主攻 AI 上的 FP16、FP32,因此在 64-bit 運算上不占優(yōu)勢。Bolt 發(fā)布的資料稱:
FP64 計算上:單芯版約 3 倍于 5090,雙芯版約 6 倍;
在電磁波模擬(如 CT、MRI、EM 兼容性掃描)中,他們聲稱性能高達 Blackwell GPU 的 300 倍;
APC 數(shù)據(jù)還提及,4c卡的模擬空間是 Blackwell B200 的 40 倍(38 億模擬單元 vs. 9110萬);
值得一提的是,Zeus還支持 IEEE-754 FP64 標準并執(zhí)行數(shù)值一致性——這對 HPC、科研人士而言,意味著結果可復現(xiàn)、可信賴。
生態(tài)或是打破壟斷的關鍵
通用 GPU(包括英偉達、AMD、Intel)基本都使用封閉 ISA,如英偉達的 PTX、AMD 的 LLVM IR+GCN、英特爾的 Xe-LPG。Bolt 不走尋常路,完全選擇基于開源 RISC-V 標量 + 向量擴展 RVV 1.0。這意味著其CPU 核設計完全自由,可定制,且編譯器可全開源,易被社區(qū)接受,而客戶也可透過 LLVM 自行構建工具鏈。
換言之,Bolt不僅做芯片,也在打造一個開放、定制、可融合的生態(tài)平臺。
當然,一塊卡若沒有配套的軟件,就只是石頭。Bolt投入大量資源開發(fā)專屬路徑追蹤引擎 Glow Stick,承諾與主流渲染工具高度兼容:包括 Blender、Maya、3DS Max、Houdini、Nuke 等。其支持高精度采樣和物理蒙特卡洛積分,Ptex、OpenShadingLanguage、多級 MipMaps;全路徑追蹤所有光學特效、包括焦散、散射等,API 提供 Shader/Pipeline 定制,開發(fā)者可深度控制等應用功能。
最重要的是,免費配套,捆綁發(fā)卡。
據(jù)了解,接下來Bolt還將推 Apollo 電磁仿真器,與 Glow Stick 并行運作,將 HPC 和渲染結合,為科研、工程提供統(tǒng)一平臺。
目前Bolt 已開始與多家行業(yè)軟件提出 SDK、插件形式合作,包括引擎集成商(如Unreal、Unity),渲染農(nóng)場管理(如 Deadline),主機操作系統(tǒng)廠商,芯片合作伙伴等。
他們甚至在構建能對接 DirectX、Vulkan 的驅(qū)動環(huán)境,但一個現(xiàn)實是——Windows 驅(qū)動生態(tài)比起 Linux(HPC)更難推進,Bolt 仍有相當工作要做。
大規(guī)模量產(chǎn)依舊遙遙無期
盡管表現(xiàn)出了很大的潛力,但目前 Bolt 暫時只有模擬器與仿真環(huán)境,要到 2025 Q3 才會交付首批開發(fā)套件,2026 年底才可能進入量產(chǎn)。這種初創(chuàng)企業(yè)常見的倒計時式壓力會考驗其資金、團隊管理、合作伙伴信任。
一旦 Tape-out 出問題、交付延誤或成本遠超預期,都可能讓這個項目被迫縮表。更何況,在過去英特爾 Arc、英偉達 40 系卡,甚至 AMD RDNA 家族產(chǎn)品上都有“產(chǎn)品性能遠低于宣傳”的案例。Bolt 的壓力顯而易見:他們必須在交付硬件時,就能提供一個性能不遜于演示的數(shù)據(jù)。
當然,軟件生態(tài)的構建又從另一方面給量產(chǎn)構成了壓力:沒有 CUDA,沒有成熟驅(qū)動,不能跑主流游戲引擎,就意味著Zeus需要在渲染和 HPC之外另辟路徑,比如專往行業(yè)軟件、科研領域扎根。他們設想“先讓電影工作者、設計師、科研人員嘗鮮”,再慢慢鋪向游戲開發(fā)者社區(qū)。但這需要幾十個樣板項目、考試級商業(yè)案才能敲定合作。
據(jù)了解,Bolt 當前已啟動早期訪問計劃(EAP),吸引了一批視覺特效藝術家和研究機構參與測試。如果這些早期用戶現(xiàn)場評價好,Bolt就有機會借助他們的作品樹立案例墻。但真正的挑戰(zhàn)在于:這些項目是否能及時轉(zhuǎn)化為商機,以及是否愿意為一套未量產(chǎn)顯卡支付數(shù)萬甚至數(shù)十萬美金?
對于光追應用來說,Bolt可以稱得上是未來可期。
如果 Bolt 真能將 Zeus 做到每幀幾十條路徑追蹤線,那樣的游戲畫面將前所未見:光照更逼真、陰影投射更柔和、大氣效果更真實。這種“電影般畫質(zhì)”的游戲可能成為未來 AAA 游戲的新目標。如果有平臺支持這種技術,玩家體驗的“圖形上限”將被重新拉高。
除此之外,未來的渲染將逐漸與模擬融合——例如建筑渲染同時進行光學、溫力、電磁多物理耦合計算。如果 Zeus 可實現(xiàn)“路徑追蹤+物理耦合”聯(lián)合加速,它可能打開一個全新的跨領域市場。Bolt的Apollo與Glow Stick,從現(xiàn)在看就是這種融合路線圖的第一步。
但以上均是從樂觀的角度看待,從PPT走向生產(chǎn),從模擬走向現(xiàn)實,從部分應用走向生態(tài)整合,Bolt 要同時戰(zhàn)勝時間、安全性、合作、用戶信任四道關。成功的可能性和失敗的風險同樣存在。但即使失敗,也是一場 “次世代 GPU 賽道”的技術試驗,為未來提供思路與經(jīng)驗。
所以,如果你關心GPU行業(yè)發(fā)展,關注圖形技術,或期待高保真渲染與模擬的結合,請把 Bolt 和 Zeus 放入你的觀察列表。因為它可能正是 GPU 領域的下一個“極端挑戰(zhàn)者”。
可左右滑動查看
*免責聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導體行業(yè)觀察。
今天是《半導體行業(yè)觀察》為您分享的第4103期內(nèi)容,歡迎關注。
加星標??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.