據(jù) The Information 報道,AI 芯片初創(chuàng)公司 Groq 正在與投資者洽談融資事宜,計劃以 60 億美元的投后估值籌集 3 至 5 億美元資金。如果這輪融資得以完成,將使這家英偉達(dá)挑戰(zhàn)者的估值較 2024 年同期的 28 億美元翻番。
推動這輪融資的是 Groq 近期展現(xiàn)出的強(qiáng)勁增長勢頭。公司向投資者表示,今年收入預(yù)計將從去年的 9,000 萬美元大幅增長至約 5 億美元,增幅超過五倍。
這一增長主要源于 Groq 與沙特阿拉伯達(dá)成的重要商業(yè)合作。今年 2 月,Groq 宣布獲得沙特方面 15 億美元的“承諾”,用于擴(kuò)大向該國的芯片銷售規(guī)模。盡管公司未明確說明這一承諾的具體約束力,但這項合作顯然為 Groq 的業(yè)務(wù)增長提供了重要支撐。此外,公司本周還宣布將在芬蘭建設(shè)數(shù)據(jù)中心,進(jìn)一步擴(kuò)大其基礎(chǔ)設(shè)施布局。
Groq 總部位于美國加州圣何塞,是當(dāng)前數(shù)十家試圖從英偉達(dá)手中奪取 AI 芯片市場份額的初創(chuàng)公司之一。Groq 的 CEO Jonathan Ross 是谷歌張量處理單元(TPU,Tensor Processing Unit)的聯(lián)合發(fā)明者之一,這款芯片至今仍為谷歌的 AI 系統(tǒng)提供核心算力。離開谷歌后,Ross 的目標(biāo)是開發(fā)出比英偉達(dá)芯片更具成本效益、速度更快且能耗更低的替代方案,而他選擇的技術(shù)路徑即為 Groq 代表性的語言處理單元(LPU,Language Processing Unit)這一全新處理器類別。
據(jù) Groq 介紹,與英偉達(dá)的通用 GPU 架構(gòu)不同,Groq 的 LPU 專門為 AI 推理而生,在設(shè)計理念上有著較大差異。GPU 采用的是“輻射式”架構(gòu),需要在計算單元和內(nèi)存之間頻繁傳輸數(shù)據(jù),而 Groq 的 LPU 則采用了“可編程流水線”架構(gòu),數(shù)據(jù)像在工廠流水線上一樣有序流動,每個處理單元都知道何時接收數(shù)據(jù)、執(zhí)行什么操作、將結(jié)果傳遞到哪里。
這種設(shè)計差異帶來了顯著的性能優(yōu)勢,LPU 的片上 SRAM 內(nèi)存帶寬高達(dá) 80TB/秒,相比之下 GPU 的外置高帶寬內(nèi)存僅為 8TB/秒,這一項就帶來了 10 倍的速度優(yōu)勢。更重要的是,LPU 的所有操作都是確定性的,軟件可以精確預(yù)測每個計算步驟的執(zhí)行時間,而這在 GPU 上幾乎是不可能實(shí)現(xiàn)的。
Groq 在技術(shù)路線上的另一個重要創(chuàng)新是“軟件優(yōu)先”的設(shè)計理念。傳統(tǒng)的 GPU 設(shè)計是硬件主導(dǎo),軟件必須適應(yīng)硬件的復(fù)雜性,每個新的 AI 模型都需要編寫專門的軟件內(nèi)核,而 Groq 則反其道而行之,先設(shè)計編譯器架構(gòu),再據(jù)此開發(fā)硬件。
這種設(shè)計哲學(xué)使得 LPU 能夠使用通用的、與模型無關(guān)的編譯器,大大簡化了軟件開發(fā)過程,開發(fā)者不再需要為每個 AI 模型編寫復(fù)雜的優(yōu)化代碼,這對于快速部署和迭代 AI 應(yīng)用具有重要意義。
且 Groq 將其技術(shù)重點(diǎn)放在模型推理服務(wù)上(而非傳統(tǒng)芯片所面向的模型訓(xùn)練場景),即為已經(jīng)訓(xùn)練完成的 AI 模型提供運(yùn)行支持。這一市場對硬件配置的要求相對靈活,且隨著 AI 應(yīng)用的普及,市場需求正在快速增長。
圖丨 Jonathan Ross(來源:Groq)
在商業(yè)模式上,Groq 主要通過提供云服務(wù)獲得收入,企業(yè)可以通過其平臺運(yùn)行各種 AI 應(yīng)用程序,這種模式類似于企業(yè)購買 OpenAI 的 API 服務(wù)或使用亞馬遜云的 AI 工具。除云服務(wù)外,Groq 還向其他公司直接銷售芯片系統(tǒng)和數(shù)據(jù)中心運(yùn)營服務(wù),加拿大電信公司貝爾等大型企業(yè)都是其客戶。據(jù)統(tǒng)計,目前已有近 200 萬開發(fā)者和團(tuán)隊使用 Groq 的服務(wù),形成了相當(dāng)規(guī)模的用戶基礎(chǔ)。
圖丨 Groq 的 LPU(來源:Groq)
當(dāng)然,快速擴(kuò)張過程中也面臨一些挑戰(zhàn)。據(jù)了解,Groq 目前約有 7 萬塊芯片在線運(yùn)行,但這一數(shù)字比公司去年設(shè)定的第一季度目標(biāo)低了至少 30%。此外,在性能表現(xiàn)上,Groq 的芯片相比英偉達(dá)的 Hopper 或最新的 Blackwell 系列仍有明顯差距。
盡管如此,投資界對 Groq 的前景保持樂觀態(tài)度。該公司此前已從多家知名機(jī)構(gòu)籌集了超過 10 億美元的投資,投資方包括資產(chǎn)管理巨頭貝萊德、思科和三星的風(fēng)險投資部門,以及 D1 Capital、Lee Fixel 的 Addition 基金、老虎環(huán)球管理等知名投資機(jī)構(gòu)。
半導(dǎo)體業(yè)務(wù)向來資本密集,因此同類公司都在積極尋求多元化的融資渠道,不僅包括股權(quán)投資,債務(wù)融資也成為重要選擇。根據(jù) The Information 的統(tǒng)計數(shù)據(jù),目前 24 家 AI 芯片初創(chuàng)公司已累計籌集超過 70 億美元資金,這一數(shù)字還在持續(xù)增長。
行業(yè)內(nèi)其他參與者也各有發(fā)展軌跡。專注于 AI 訓(xùn)練芯片的 Cerebras 去年曾計劃上市,但因監(jiān)管部門對其與阿聯(lián)酋科技公司 G42 關(guān)系的審查而暫時擱置——G42 貢獻(xiàn)了 Cerebras 約 90% 的收入,這種高度依賴關(guān)系引起了監(jiān)管關(guān)注。今年 5 月,Cerebras 的 CEO 在公開場合表示,公司仍希望在年內(nèi)完成上市計劃。
另一家值得關(guān)注的公司 D-Matrix 專門開發(fā)用于高效運(yùn)行大型語言模型的 AI 芯片。據(jù)知情人士透露,D-Matrix 去年開始尋求籌集 2.5 億美元資金,目前已完成約 1.2 億美元的融資,正在努力籌集剩余的 1.8 億美元,目標(biāo)總?cè)谫Y規(guī)模為 3 億美元。
另外,越來越多的芯片初創(chuàng)公司開始將目光投向中東市場,主要原因是該地區(qū)英偉達(dá)芯片供應(yīng)相對有限,為其他廠商創(chuàng)造了機(jī)會。例如,同樣來自加州的 SambaNova Systems 就在為沙特阿美石油公司提供芯片系統(tǒng)和軟件服務(wù),協(xié)助后者開發(fā)名為 Metabrain 的大型語言模型項目。
對于這些英偉達(dá)的挑戰(zhàn)者而言,當(dāng)前的市場環(huán)境既充滿機(jī)遇也存在挑戰(zhàn)。一方面,AI 技術(shù)的快速發(fā)展確實(shí)創(chuàng)造了巨大的專用芯片需求;另一方面,要說服已經(jīng)適應(yīng)英偉達(dá)生態(tài)系統(tǒng)的開發(fā)者轉(zhuǎn)換平臺,仍然是一個相當(dāng)復(fù)雜的過程。
隨著 AI 應(yīng)用場景的不斷擴(kuò)展,專用推理芯片的市場需求預(yù)計將持續(xù)增長。這些英偉達(dá)的挑戰(zhàn)者們,何時能撼動這個 4 萬億美元估值的“巨無霸”,讓我們拭目以待。
參考資料:
1.https://www.theinformation.com/articles/nvidia-challenger-groq-discusses-6-billion-valuation?rc=5ypkcx
2.https://groq.com/blog/the-groq-lpu-explained
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.