一場(chǎng)AI領(lǐng)域的世紀(jì)大斗法,正在中美之間展開。
1月22日,特朗普啟動(dòng)星際之門計(jì)劃,要投入5000億美元,也就是用相當(dāng)于建設(shè)10個(gè)三峽大壩的錢來建設(shè)AI基礎(chǔ)設(shè)施,要在算力優(yōu)勢(shì)上徹底碾壓中國。特朗普在發(fā)布會(huì)現(xiàn)場(chǎng)直接說:中國是競(jìng)爭(zhēng)對(duì)手,我們要讓這些設(shè)施留在本土。
但沒想到,沒過幾天,來自中國的大模型DeepSeek就在春節(jié)期間引發(fā)了全球科技圈大地震,雖然算力被卡脖子,但它以超強(qiáng)的算法取勝,甚至有希望帶領(lǐng)整個(gè)行業(yè)走出做大模型必須買卡拼算力的傳統(tǒng)燒錢路徑,讓賣卡的英偉達(dá)一夜蒸發(fā)近6000億美元市值,比星際之門的總預(yù)算還高。
中國向來不缺算法高手,TikTok能引起美國官方那么大的恐慌,正是因?yàn)樗乃惴ㄗ屆绹癖娪T不能。
那么算力和算法,到底哪個(gè)是AI的勝負(fù)手,現(xiàn)在誰都沒有答案。但我想借這個(gè)機(jī)會(huì)給你講清楚,算力到底是什么,以及DeepSeek的算法到底厲害在哪里。
先說算力。
舉個(gè)例子,一位老司機(jī)在擁堵時(shí)段,可以憑經(jīng)驗(yàn)和技術(shù)在一定程度上避開擁堵,提高出行效率。這里的經(jīng)驗(yàn)和技術(shù)可以理解為司機(jī)的“算力”。
在這個(gè)互聯(lián)網(wǎng)、大數(shù)據(jù)無處不在的時(shí)代,算力可以理解為集信息處理能力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力。
老司機(jī)的算力比新手高,所以創(chuàng)造了更高的經(jīng)濟(jì)價(jià)值;滴滴大腦的算力又比老司機(jī)高,創(chuàng)造的經(jīng)濟(jì)價(jià)值自然也更高。
所以算力已經(jīng)跟經(jīng)濟(jì)形成了強(qiáng)相關(guān)關(guān)系。
2022年,清華全球產(chǎn)業(yè)研究院編制的報(bào)告(2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告)中就明確提到,算力指數(shù)平均每提高1‰,數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.5‰和1.8‰;中國信息通信院發(fā)布的白皮書(2022年中國算力發(fā)展指數(shù)白皮書)測(cè)算,算力每投入1塊錢,將帶動(dòng)3-4塊錢的經(jīng)濟(jì)產(chǎn)出。
所以,算力,正在決定著國力。
那么算力本身從商業(yè)角度又是怎樣一門生意呢?
先說算力的載體,也就是我們都很熟悉的芯片。
當(dāng)前的算力主要分為通用算力、智能算力和超級(jí)算力。三類算力分別對(duì)應(yīng)三類芯片。
通用算力對(duì)應(yīng)CPU,它屬于基礎(chǔ)算力,重點(diǎn)在于通用性,比如網(wǎng)頁服務(wù)、數(shù)據(jù)庫操作和數(shù)據(jù)處理基本都是用通用算力。這一領(lǐng)域由CPU雙雄Intel、AMD主導(dǎo),也有海光、龍芯、華為等國產(chǎn)之光。
智能算力對(duì)應(yīng)GPU、FPGA、ASIC等專業(yè)加速芯片。相比于通算的通用性,智算更側(cè)重“個(gè)性”,主打一個(gè)專業(yè)、精準(zhǔn)、智能,比如智能安防、自動(dòng)駕駛中常用到的圖像識(shí)別,基本都要用智算。這一領(lǐng)域的核心玩家是英偉達(dá)、博通,以及被AMD收購的賽靈思。
而超級(jí)算力就更厲害了,它通常用來解決非常復(fù)雜的科學(xué)和工程問題,比如氣象預(yù)報(bào)、航空航天、藥物研發(fā)。通算和智算的算力可以由單體芯片搞定,而超算必須依靠不同類型芯片組成的集群才能上崗。比如英偉達(dá)的Blackwell超級(jí)芯片、AMD的MI300A,都是“GPU+CPU”組合。
芯片是算力的載體,而算力的呈現(xiàn)形式是算力中心。
這里面又分成兩類:一類是企業(yè)自建,一般是對(duì)算力需求大、資金實(shí)力雄厚的巨頭,比如阿里云、騰訊云、華為云都自建通算中心,中國電信、聯(lián)通、吉利都自建智算中心。
第二類是算力租賃,小企業(yè)建不起,但是算力又是剛需,自然就產(chǎn)生了自己建設(shè)、出租賺錢的生意,比如浪潮信息、云賽智聯(lián)、阿里、百度都有算力租賃業(yè)務(wù)。
算力租賃的形式都比較靈活,可以按含有多張GPU的整臺(tái)服務(wù)器租賃、也可以按單張GPU租賃,時(shí)間短至幾小時(shí)、長(zhǎng)至兩三年,都可以,對(duì)小微企業(yè)很友好。
說回星際之門,它本質(zhì)上就是OpenAI的自建的數(shù)據(jù)和算力中心。但星際之門可不只是OpenAI自己的項(xiàng)目,它不但牽涉到日本軟銀、阿布扎比MGX等國際資本,也把數(shù)據(jù)服務(wù)商甲骨文、芯片供應(yīng)商英偉達(dá)、Arm等科技巨頭拉入伙,在落地的建設(shè)中,還會(huì)有更多中小科技公司參與,這是一個(gè)帶動(dòng)AI全產(chǎn)業(yè)鏈共同發(fā)展的大項(xiàng)目。
截至2023年底,美國和中國的算力基礎(chǔ)設(shè)施規(guī)模,分別占全球的32%和26%。而有了星際之門,美國的優(yōu)勢(shì)顯然會(huì)進(jìn)一步擴(kuò)大。
現(xiàn)在你應(yīng)該明白了,算力的關(guān)鍵是“力”,大力出奇跡;而算法的關(guān)鍵是“法”,是技巧,如果技巧高超,一樣可以四兩撥千斤。
比如大模型的基礎(chǔ)架構(gòu)一般分兩類,稠密模型和專家模型。
稠密模型就是每次響應(yīng)指令,都要整個(gè)大模型一起上,所有參數(shù)都會(huì)激活,GPT-3.5就是這種架構(gòu),準(zhǔn)確度確實(shí)高,也很全面,但是真燒錢。
而專家模型經(jīng)濟(jì)實(shí)惠,你可以把這種架構(gòu)的大模型想象成一個(gè)專家團(tuán),整個(gè)團(tuán)隊(duì)無所不能,但每個(gè)專家擅長(zhǎng)的領(lǐng)域不一樣。你讓大模型給你做張表,他就讓擅長(zhǎng)邏輯和繪圖的專家為你服務(wù),別的專家不用管。GPT-4就屬于專家模型,它有16個(gè)專家模塊,總計(jì)超過1.67萬億個(gè)參數(shù),平均每個(gè)專家背后有1000億個(gè)參數(shù),每次響應(yīng)指令時(shí),大約一到兩個(gè)專家會(huì)被激活,也就是一兩千億個(gè)參數(shù),大大降低了計(jì)算量。
DeepSeek就更牛了,它不但采用了專家模型,還給專家做了更細(xì)粒度的劃分,讓專家更專門化,每個(gè)專家只有幾十億個(gè)參數(shù),不到GPT-4的1/10,所以它響應(yīng)更快。
更絕的是,DeepSeek還把一些專家設(shè)置成“共享專家”,用來解決不同領(lǐng)域交叉地帶的問題,這樣普通的專家就不需要有知識(shí)冗余,更加輕量化,所以V3在激活相同數(shù)量專家和參數(shù)的情況下表現(xiàn)更好。
但是DeepSeek的出現(xiàn),并不能讓我們高枕無憂,OpenAI、Meta等等大廠都在快速追趕,就在前幾天,AI教母李飛飛團(tuán)隊(duì)訓(xùn)練出了媲美DeepSeek R1的大模型,只用了16個(gè)英偉達(dá)H100 GPU,其中云計(jì)算費(fèi)用還不到50美元。形勢(shì)不容我們放松,不進(jìn)則退。
你體驗(yàn)DeepSeek了嗎?有沒有用過其他的大模型?評(píng)論區(qū)聊聊你的感受吧。
作者 | 吳婷
嘉賓商學(xué)創(chuàng)辦人吳婷
參考資料:
[1]朱帥:“AI曼哈頓計(jì)劃”,美國會(huì)如何鋪開.環(huán)球網(wǎng).2024.
[2]3.6萬億的史上最大AI項(xiàng)目引發(fā)罵戰(zhàn).新浪AI.2024
[3]微軟解綁:OpenAI獲更大AI算力自主權(quán).砍柴網(wǎng).2024
[4]微軟與OpenAI背刺,英偉達(dá)InfiniBand危險(xiǎn)了.數(shù)據(jù)猿.2024
[5]OpenAI聯(lián)手軟銀、甲骨文啟動(dòng)千億美元AI基建.藍(lán)鯨財(cái)經(jīng).2024
[6]算力租賃是一門好生意嗎.中國經(jīng)濟(jì)網(wǎng).2024
[7]中國算力進(jìn)化史.AI財(cái)經(jīng)社.2022
[8]聯(lián)發(fā)科與NVIDIA合作打造全新的NVIDIA GB10超級(jí)芯片.太平洋科技.2025
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.