公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
來(lái)源:內(nèi)容編譯自tomshardware。
OpenAI 首席執(zhí)行官 Sam Altman并不以目光短淺而聞名,但他最近的言論甚至突破了他一貫的大膽技術(shù)言論的界限。在 X 上的一篇新文章中,Altman 透露,OpenAI 有望在今年年底前“上線超過(guò) 100 萬(wàn)個(gè) GPU”。僅此一個(gè)數(shù)字就已經(jīng)很驚人了。
想想埃隆馬斯克的 xAI,它在今年早些時(shí)候憑借其 Grok 4 模型引起轟動(dòng),運(yùn)行在大約 200,000 個(gè) Nvidia H100 GPU 上。OpenAI 的計(jì)算能力是這個(gè)的五倍,但對(duì)于 Altman 來(lái)說(shuō)這還不夠。“為團(tuán)隊(duì)感到非常自豪......”他寫道,“但現(xiàn)在他們最好開始研究如何將其提高 100 倍,哈哈。”
“哈哈”可能聽起來(lái)像是在開玩笑,但 Altman 的過(guò)往經(jīng)歷表明并非如此。早在 2 月份,他就承認(rèn) OpenAI 不得不放慢 GPT-4.5 的推出速度,因?yàn)樗麄儗?shí)際上“ GPU 用完了”。這可不是小問(wèn)題;考慮到Nvidia 的頂級(jí) AI 硬件到明年的訂單也已售罄,這可謂一記警鐘。
此后,Altman 將計(jì)算擴(kuò)展作為首要任務(wù),尋求合作伙伴關(guān)系和基礎(chǔ)設(shè)施項(xiàng)目,這些項(xiàng)目看起來(lái)更像是全國(guó)性的行動(dòng),而非企業(yè) IT 升級(jí)。當(dāng) OpenAI 在今年晚些時(shí)候達(dá)到 100 萬(wàn)個(gè) GPU 的里程碑時(shí),它將不僅僅是社交媒體的炫耀——它將鞏固自己作為全球最大 AI 計(jì)算消費(fèi)者的地位。
無(wú)論如何,讓我們來(lái)談?wù)勀莻€(gè) 100 倍的目標(biāo)吧,因?yàn)樗犉饋?lái)確實(shí)很瘋狂。按照目前的市場(chǎng)價(jià)格,1 億塊 GPU 的成本約為 3 萬(wàn)億美元——幾乎相當(dāng)于英國(guó)的 GDP——這還不包括電力需求或容納這些 GPU 所需的數(shù)據(jù)中心。Nvidia短期內(nèi)根本不可能生產(chǎn)出這么多芯片,更不用說(shuō)滿足所有 GPU 的能源需求了。然而,這正是 Altman 的“登月計(jì)劃”式思維。這與其說(shuō)是一個(gè)字面意義上的目標(biāo),不如說(shuō)是為通用人工智能 (AGI) 奠定基礎(chǔ),無(wú)論這意味著定制芯片、奇特的新架構(gòu),還是我們尚未見過(guò)的東西。OpenAI 顯然想要找到答案。
最活生生的例子就是OpenAI位于德克薩斯州的數(shù)據(jù)中心,它目前是全球最大的單體設(shè)施,耗電量約為300兆瓦——足以為一座中型城市供電——預(yù)計(jì)到2026年中期將達(dá)到1千兆瓦。如此巨大且難以預(yù)測(cè)的能源需求已經(jīng)引起了德克薩斯州電網(wǎng)運(yùn)營(yíng)商的關(guān)注。他們警告說(shuō),要穩(wěn)定如此規(guī)模的數(shù)據(jù)中心的電壓和頻率,需要成本高昂且快速的基礎(chǔ)設(shè)施升級(jí),即使是州公用事業(yè)公司也難以匹敵。無(wú)論如何,創(chuàng)新必須占上風(fēng),泡沫不應(yīng)該破裂。
OpenAI 并非僅僅囤積 NVIDIA 硬件。雖然微軟的 Azure 仍然是其主要的云骨干,但OpenAI 已與甲骨文合作構(gòu)建自己的數(shù)據(jù)中心,并且據(jù)傳正在探索谷歌的 TPU 加速器,以使其計(jì)算堆棧多樣化。這是一場(chǎng)更大規(guī)模軍備競(jìng)賽的一部分,從Meta到亞馬遜,每家公司都在自主研發(fā) AI 芯片,并大力投資高帶寬內(nèi)存 (HBM),以支持這些龐大的模型。Altman 則暗示了 OpenAI 自己的定制芯片計(jì)劃,考慮到公司不斷增長(zhǎng)的規(guī)模,這并非偶然。
Altman 的評(píng)論也毫不掩飾地提醒我們,這個(gè)領(lǐng)域的發(fā)展速度有多么快。一年前,一家擁有 1 萬(wàn)塊 GPU 的公司聽起來(lái)就像是一個(gè)重量級(jí)的競(jìng)爭(zhēng)者。而現(xiàn)在,即使是 100 萬(wàn)塊 GPU,也感覺(jué)只是邁向更大目標(biāo)的墊腳石。OpenAI 推進(jìn)基礎(chǔ)設(shè)施建設(shè)的目的不僅僅是加快訓(xùn)練速度或更順暢的模型部署;而是為了在這個(gè)計(jì)算能力最終成為瓶頸的行業(yè)中確保長(zhǎng)期優(yōu)勢(shì)。當(dāng)然,Nvidia 非常樂(lè)意提供這些基礎(chǔ)模塊。
1億個(gè)GPU現(xiàn)實(shí)嗎?目前還不行,除非在制造、能源效率和成本方面取得突破。但這正是關(guān)鍵所在。Altman的愿景并非局限于現(xiàn)有資源,而是著眼于未來(lái)的可能性。年底前上線的100萬(wàn)個(gè)GPU,是標(biāo)志著AI基礎(chǔ)設(shè)施新基線的真正催化劑,而這個(gè)基線似乎正在日益多樣化。除此之外,一切都是雄心勃勃的目標(biāo),如果Altman的歷史可以作為借鑒,那么將其視為純粹的炒作或許是愚蠢的。
https://www.tomshardware.com/tech-industry/sam-altman-teases-100-million-gpu-scale-for-openai-that-could-cost-usd3-trillion-chatgpt-maker-to-cross-well-over-1-million-by-end-of-year
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4102期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送,小號(hào)防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.