網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

黃仁勛扔出的算力核彈是堆疊嗎？馬斯克開源的大模型Grok才是全球最大嗎？

2024-03-20 21:15:27　來源: 制造界

山東舉報

分享至

來源：制造界

作者：秀二

圖源：截圖

1/黃仁勛的算力核彈：GB200

北京時間3月19日凌晨，黃仁勛扔出了一個“算力核彈”，基于英偉達Blackwell架構(gòu)的B200芯片。據(jù)介紹，Blackwell平臺能夠在萬億參數(shù)級的大型語言模型（LLM）上構(gòu)建和運行實時生成式AI，而成本和能耗比前身低25倍。

黃仁勛現(xiàn)場展示Grace-Blackwell系統(tǒng)（兩個Blackwell GPU、四個die與一個Grace Cpu連接在一起）。GB200將兩個B200 Blackwell GPU與一個基于Arm的Grace CPU進行配對。新芯片擁有2080億個晶體管，所有這些晶體管幾乎同時訪問與芯片連接的內(nèi)存。將成為亞馬遜、微軟、谷歌這類全球最大數(shù)據(jù)中心運營商部署新電腦和其他產(chǎn)品的基礎(chǔ)。

黃仁勛舉例稱，如果要訓(xùn)練一個1.8萬億參數(shù)量的GPT模型，需要8000張Hopper GPU，消耗15兆瓦的電力，連續(xù)跑上90天。但如果使用Blackwell GPU，只需要2000張，同樣跑90天只要消耗四分之一的電力。

英偉達表示，基于Blackwell的處理器，如GB200，為人工智能公司提供了巨大的性能升級，其AI性能為每秒20千萬億次浮點運算，而H100為每秒4千萬億次浮點運算。該系統(tǒng)可以部署一個27萬億參數(shù)的模型。黃仁勛稱，毫無疑問，微軟Azure、AWS、谷歌云等一眾科技巨頭都是Blackwell架構(gòu)的首批用戶。

黃仁勛說，“三十年來，我們一直在追求加速計算，目標是實現(xiàn)深度學(xué)習(xí)和AI這方面的變革性突破。生成式AI是我們這個時代的決定性技術(shù)。Blackwell是推動這場新工業(yè)革命的引擎。通過與世界上最具活力的公司合作，我們將實現(xiàn)AI在各行各業(yè)的承諾。”

英偉達在公告通稿中列舉了將采用Blackwell的一些組織，比如微軟、亞馬遜、谷歌、Meta、戴爾、OpenAI、甲骨文、馬斯克領(lǐng)導(dǎo)的特斯拉和xAI。黃仁勛介紹了包括這些公司在內(nèi)的更多合作伙伴。

黃仁勛在演講中還官宣了一系列合作。其中提到，全球最大電動車公司比亞迪將采用英偉達下一代智能汽車芯片Thor，比亞迪同時將使用英偉達基礎(chǔ)設(shè)施進行自動駕駛模型訓(xùn)練，以及英偉達Isaac來設(shè)計/模擬智能工廠機器人。

業(yè)內(nèi)人士仔細剖析一下英偉達Blackwell架構(gòu)的B200芯片，B200芯片并不是單一的GPU，而是通過互聯(lián)和堆疊技術(shù)，將多個GPU集成在一起。黃仁勛說過，創(chuàng)新不僅僅是芯片，而是整個堆疊，就是這個道理。

2/華為最擅長的，就是聯(lián)接和堆疊

華為最擅長的就是聯(lián)接和堆疊、是華為，因為華為是通訊巨頭，利用通訊領(lǐng)域的數(shù)據(jù)技術(shù)打通了芯片和芯片之間的通訊，華為早在6年前就開始在算力集群上發(fā)力。在2023年7月舉行的昇騰人工智能產(chǎn)業(yè)高峰論壇上，華為宣布昇騰AI集群全面升級，集群規(guī)模從最初的4000卡集群擴展至16000卡，是業(yè)界首個萬卡AI集群，擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期，十倍領(lǐng)先業(yè)界。

去年9月，華為推出全新架構(gòu)的昇騰AI計算集群——Atlas 900 SuperCluster，可支持超萬億參數(shù)的大模型訓(xùn)練。新集群采用了全新的華為星河AI智算交換機CloudEngine XH16800，借助其高密的800GE端口能力，兩層交換網(wǎng)絡(luò)即可實現(xiàn)2250節(jié)點（等效于18000張卡）超大規(guī)模無收斂集群組網(wǎng)。

按照昇騰的指標，1000卡的算力約300P，千卡就能提升約30P，萬卡就能提升約300P。

想象一下，18000張GPU卡高速互聯(lián)在一起，是什么景象？這才是史詩級的超級AI計算機！

據(jù)了解，目前國產(chǎn)大模型有超過一半都是基于昇騰AI孵化出來的。

科大訊飛創(chuàng)始人劉慶峰摸著華為的算力底座，激動地說，訊飛的星火認知大模型全部用國產(chǎn)算力訓(xùn)練出來的，我們國產(chǎn)算力在戰(zhàn)略環(huán)節(jié)上站住了！

3/全球最大，馬斯克收獲3.5萬個星標

央視財經(jīng)最新報道，馬斯克的XAI公司親自開發(fā)的大模型Grok，已于17日開源，不到三天就在托管網(wǎng)站（Github）收獲超過35000個星標。不少人工智能行業(yè)內(nèi)的企業(yè)都表達了高度關(guān)注，稱將對Grok進行進一步的研究和開發(fā)。

據(jù)官網(wǎng)介紹，本次開源的Grok第一代產(chǎn)品Grok-1擁有3140億參數(shù)，是迄今全球參數(shù)量最大的開源大語言模型。相比之下，Meta公司旗下的開源模型Llama 2參數(shù)規(guī)模為70億到700億，而OpenAI的GPT-3.5參數(shù)規(guī)模為1750億。有分析認為，由于模型規(guī)模龐大，許多小型開發(fā)者實際上難以真正將Grok運行起來。業(yè)內(nèi)人士估計，大約需要8張H100計算卡才能滿足要求。

根據(jù)Grok-1遵循的開源協(xié)議，個人或企業(yè)可以自由使用、修改和發(fā)布軟件，包括商業(yè)用途。因此有分析認為，Grok-1的開源也為許多AI初創(chuàng)公司提供了另一個選擇。一些人工智能初創(chuàng)公司已經(jīng)表示，將會基于Grok模型進行對話式搜索和推理的微調(diào)。

奧爾特曼日前接受美國知名播客Lex Friedman的專訪，談及與馬斯克（Elon Musk）之間的法律紛爭,奧爾特曼在對話表示，當(dāng)年是馬斯克選擇分道揚鑣，尤其他希望OpenAI被特斯拉收購，并讓特斯拉完全控制OpenAI。

奧爾特曼還表示，“他認為OpenAI將會失敗，他希望能夠完全掌控并扭轉(zhuǎn)局勢。而我們則希望繼續(xù)朝著現(xiàn)在OpenAI的方向前進。他還希望特斯拉能夠開展AGI項目。在不同時期，他都想把OpenAI變成一家盈利公司，由他掌控，或者與特斯拉合并。但我們不想這么做，于是他決定離開，這其實挺好的。”

馬斯克和奧爾特曼誰是誰非并不重要。重要的是胸懷和格局，真正推動人工智能發(fā)展造福人類。

聯(lián)系我們：txm176（值班微信）廣告及商務(wù)合作：電話18660411611投稿及采訪約談：郵箱447377407@qq.com

版權(quán)聲明：制造界除發(fā)布原創(chuàng)文章外，亦致力于優(yōu)秀文章的交流分享。轉(zhuǎn)載須注明文章來源和作者；申請轉(zhuǎn)載授權(quán)請在文末或后臺留言。版權(quán)所有，違者必究。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.