來源:制造界
作者:秀二
圖源:截圖
1/黃仁勛的算力核彈:GB200
北京時間3月19日凌晨,黃仁勛扔出了一個“算力核彈”,基于英偉達Blackwell架構(gòu)的B200芯片。據(jù)介紹,Blackwell平臺能夠在萬億參數(shù)級的大型語言模型(LLM)上構(gòu)建和運行實時生成式AI,而成本和能耗比前身低25倍。
黃仁勛現(xiàn)場展示Grace-Blackwell系統(tǒng)(兩個Blackwell GPU、四個die與一個Grace Cpu連接在一起)。GB200將兩個B200 Blackwell GPU與一個基于Arm的Grace CPU進行配對。新芯片擁有2080億個晶體管,所有這些晶體管幾乎同時訪問與芯片連接的內(nèi)存。將成為亞馬遜、微軟、谷歌這類全球最大數(shù)據(jù)中心運營商部署新電腦和其他產(chǎn)品的基礎(chǔ)。
黃仁勛舉例稱,如果要訓(xùn)練一個1.8萬億參數(shù)量的GPT模型,需要8000張Hopper GPU,消耗15兆瓦的電力,連續(xù)跑上90天。但如果使用Blackwell GPU,只需要2000張,同樣跑90天只要消耗四分之一的電力。
英偉達表示,基于Blackwell的處理器,如GB200,為人工智能公司提供了巨大的性能升級,其AI性能為每秒20千萬億次浮點運算,而H100為每秒4千萬億次浮點運算。該系統(tǒng)可以部署一個27萬億參數(shù)的模型。黃仁勛稱,毫無疑問,微軟Azure、AWS、谷歌云等一眾科技巨頭都是Blackwell架構(gòu)的首批用戶。
黃仁勛說,“三十年來,我們一直在追求加速計算,目標是實現(xiàn)深度學(xué)習(xí)和AI這方面的變革性突破。生成式AI是我們這個時代的決定性技術(shù)。Blackwell是推動這場新工業(yè)革命的引擎。通過與世界上最具活力的公司合作,我們將實現(xiàn)AI在各行各業(yè)的承諾。”
英偉達在公告通稿中列舉了將采用Blackwell的一些組織,比如微軟、亞馬遜、谷歌、Meta、戴爾、OpenAI、甲骨文、馬斯克領(lǐng)導(dǎo)的特斯拉和xAI。黃仁勛介紹了包括這些公司在內(nèi)的更多合作伙伴。
黃仁勛在演講中還官宣了一系列合作。其中提到,全球最大電動車公司比亞迪將采用英偉達下一代智能汽車芯片Thor,比亞迪同時將使用英偉達基礎(chǔ)設(shè)施進行自動駕駛模型訓(xùn)練,以及英偉達Isaac來設(shè)計/模擬智能工廠機器人。
業(yè)內(nèi)人士仔細剖析一下英偉達Blackwell架構(gòu)的B200芯片,B200芯片并不是單一的GPU,而是通過互聯(lián)和堆疊技術(shù),將多個GPU集成在一起。黃仁勛說過,創(chuàng)新不僅僅是芯片,而是整個堆疊,就是這個道理。
2/華為最擅長的,就是聯(lián)接和堆疊
華為最擅長的就是聯(lián)接和堆疊、是華為,因為華為是通訊巨頭,利用通訊領(lǐng)域的數(shù)據(jù)技術(shù)打通了芯片和芯片之間的通訊,華為早在6年前就開始在算力集群上發(fā)力。在2023年7月舉行的昇騰人工智能產(chǎn)業(yè)高峰論壇上,華為宣布昇騰AI集群全面升級,集群規(guī)模從最初的4000卡集群擴展至16000卡,是業(yè)界首個萬卡AI集群,擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期,十倍領(lǐng)先業(yè)界。
去年9月,華為推出全新架構(gòu)的昇騰AI計算集群——Atlas 900 SuperCluster,可支持超萬億參數(shù)的大模型訓(xùn)練。新集群采用了全新的華為星河AI智算交換機CloudEngine XH16800,借助其高密的800GE端口能力,兩層交換網(wǎng)絡(luò)即可實現(xiàn)2250節(jié)點(等效于18000張卡)超大規(guī)模無收斂集群組網(wǎng)。
按照昇騰的指標,1000卡的算力約300P,千卡就能提升約30P,萬卡就能提升約300P。
想象一下,18000張GPU卡高速互聯(lián)在一起,是什么景象?這才是史詩級的超級AI計算機!
據(jù)了解,目前國產(chǎn)大模型有超過一半都是基于昇騰AI孵化出來的。
科大訊飛創(chuàng)始人劉慶峰摸著華為的算力底座,激動地說,訊飛的星火認知大模型全部用國產(chǎn)算力訓(xùn)練出來的,我們國產(chǎn)算力在戰(zhàn)略環(huán)節(jié)上站住了!
3/全球最大,馬斯克收獲3.5萬個星標
央視財經(jīng)最新報道,馬斯克的XAI公司親自開發(fā)的大模型Grok,已于17日開源,不到三天就在托管網(wǎng)站(Github)收獲超過35000個星標。不少人工智能行業(yè)內(nèi)的企業(yè)都表達了高度關(guān)注,稱將對Grok進行進一步的研究和開發(fā)。
據(jù)官網(wǎng)介紹,本次開源的Grok第一代產(chǎn)品Grok-1擁有3140億參數(shù),是迄今全球參數(shù)量最大的開源大語言模型。相比之下,Meta公司旗下的開源模型Llama 2參數(shù)規(guī)模為70億到700億,而OpenAI的GPT-3.5參數(shù)規(guī)模為1750億。有分析認為,由于模型規(guī)模龐大,許多小型開發(fā)者實際上難以真正將Grok運行起來。業(yè)內(nèi)人士估計,大約需要8張H100計算卡才能滿足要求。
根據(jù)Grok-1遵循的開源協(xié)議,個人或企業(yè)可以自由使用、修改和發(fā)布軟件,包括商業(yè)用途。因此有分析認為,Grok-1的開源也為許多AI初創(chuàng)公司提供了另一個選擇。一些人工智能初創(chuàng)公司已經(jīng)表示,將會基于Grok模型進行對話式搜索和推理的微調(diào)。
奧爾特曼日前接受美國知名播客Lex Friedman的專訪,談及與馬斯克(Elon Musk)之間的法律紛爭,奧爾特曼在對話表示,當(dāng)年是馬斯克選擇分道揚鑣,尤其他希望OpenAI被特斯拉收購,并讓特斯拉完全控制OpenAI。
奧爾特曼還表示,“他認為OpenAI將會失敗,他希望能夠完全掌控并扭轉(zhuǎn)局勢。而我們則希望繼續(xù)朝著現(xiàn)在OpenAI的方向前進。他還希望特斯拉能夠開展AGI項目。在不同時期,他都想把OpenAI變成一家盈利公司,由他掌控,或者與特斯拉合并。但我們不想這么做,于是他決定離開,這其實挺好的。”
馬斯克和奧爾特曼誰是誰非并不重要。重要的是胸懷和格局,真正推動人工智能發(fā)展造福人類。
聯(lián)系我們:txm176(值班微信)廣告及商務(wù)合作:電話18660411611投稿及采訪約談:郵箱447377407@qq.com
版權(quán)聲明:制造界除發(fā)布原創(chuàng)文章外,亦致力于優(yōu)秀文章的交流分享。轉(zhuǎn)載須注明文章來源和作者;申請轉(zhuǎn)載授權(quán)請在文末或后臺留言。版權(quán)所有,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.