文章作者丨貝恩公司:Peter Hanbury and Jue Wang,慎思行采編翻譯
個(gè)人微信丨hello_SSX
成立于2023年的中國(guó)人工智能初創(chuàng)公司DeepSeek在業(yè)內(nèi)迅速掀起了波瀾。這家員工不到200人的公司得到了量化基金幻方量化(管理著80億美元資產(chǎn))的支持,在OpenAI宣布價(jià)值5000億美元的星際之門(mén)項(xiàng)目的前一天,該公司發(fā)布了其開(kāi)源模型DeepSeek R1。
DeepSeek的與眾不同之處在于其極具成本效益的前景。該公司聲稱,使用2,000個(gè)Nvidia H800圖形處理器(GPU)訓(xùn)練模型的成本僅為600萬(wàn)美元,而GPT-4的成本為8,000萬(wàn)至1億美元,Meta的LLaMA 3需要16,000個(gè)H100 GPU。雖然這種比較相差甚遠(yuǎn),但理解其中的可能性是有價(jià)值的。
DeepSeek的迅速普及凸顯了其潛在的影響力。短短幾天內(nèi),它就成為美國(guó)應(yīng)用商店中最受歡迎的免費(fèi)應(yīng)用,催生了700多個(gè)開(kāi)源衍生產(chǎn)品(而且還在不斷增加),并被微軟、AWS和Nvidia AI平臺(tái)采用。
DeepSeek的性能似乎是建立在一系列工程創(chuàng)新的基礎(chǔ)上,這些創(chuàng)新大大降低了推理成本,同時(shí)也提高了訓(xùn)練成本。其mixture-of-experts(MoE)架構(gòu)在處理每個(gè)標(biāo)記時(shí)只激活6710億個(gè)參數(shù)中的370億個(gè),在不犧牲性能的情況下減少了計(jì)算開(kāi)銷。公司還優(yōu)化了提煉技術(shù),允許將大型模型的推理能力轉(zhuǎn)移到小型模型中。通過(guò)使用強(qiáng)化學(xué)習(xí),DeepSeek無(wú)需進(jìn)行大量的監(jiān)督微調(diào)即可提高性能。此外,它的多頭潛在注意力(MHLA)機(jī)制將內(nèi)存使用率降低到了5%,而以前的方法只有13%。
除了模型架構(gòu),DeepSeek還改進(jìn)了數(shù)據(jù)處理方式。它采用FP8混合精度的混合/低精度計(jì)算方法,降低了計(jì)算成本。優(yōu)化的獎(jiǎng)勵(lì)函數(shù)可確保計(jì)算能力分配給高價(jià)值的訓(xùn)練數(shù)據(jù),避免在冗余信息上浪費(fèi)資源。公司還采用了稀疏性技術(shù),使模型能夠預(yù)測(cè)特定輸入所需的參數(shù),從而提高速度和效率。DeepSeek的硬件和系統(tǒng)級(jí)優(yōu)化進(jìn)一步提高了性能。公司開(kāi)發(fā)了內(nèi)存壓縮和負(fù)載平衡技術(shù),以最大限度地提高效率。具體來(lái)說(shuō),一種新穎的優(yōu)化技術(shù)是使用PTX編程而不是CUDA,從而使DeepSeek工程師能夠更好地控制GPU指令的執(zhí)行,提高GPU的使用效率。此外,DeepSeek還利用DualPipe算法改進(jìn)了GPU之間的通信,使GPU能夠在訓(xùn)練過(guò)程中更有效地進(jìn)行通信和計(jì)算。
到目前為止,這些結(jié)果并不令人驚訝;事實(shí)上,它們與人工智能效率的大趨勢(shì)相吻合(見(jiàn)圖1)。更令人驚訝的是,一家開(kāi)源的中國(guó)初創(chuàng)公司已經(jīng)設(shè)法縮小或至少顯著縮小了與領(lǐng)先的專有模型之間的性能差距。
圖1
由于創(chuàng)新,人工智能推理成本迅速下降,DeepSeek也順應(yīng)了這一趨勢(shì)
注:大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)衡量大型語(yǔ)言模型(LLM)理解語(yǔ)言和解決問(wèn)題的能力,結(jié)果由模型提供者報(bào)告或通過(guò)外部評(píng)估得出;83分和42分是性能基準(zhǔn),越高越好。
資料來(lái)源:A16Z;貝恩分析
懷疑和市場(chǎng)影響
盡管DeepSeek聲稱如此,但仍存在一些不確定因素。訓(xùn)練模型的真實(shí)成本仍未得到證實(shí),人們猜測(cè)該公司是否混合使用了高端和低端GPU。此外,還有人提出了知識(shí)產(chǎn)權(quán)方面的問(wèn)題,特別是有關(guān)提煉所使用的來(lái)源和方法。一些批評(píng)者認(rèn)為,DeepSeek并沒(méi)有從根本上引入新技術(shù),而只是對(duì)現(xiàn)有技術(shù)進(jìn)行了改進(jìn)。盡管如此,董事會(huì)和領(lǐng)導(dǎo)團(tuán)隊(duì)現(xiàn)在正密切關(guān)注人工智能效率的提高會(huì)如何影響長(zhǎng)期投資計(jì)劃和戰(zhàn)略。
有幾種催化劑可以有效抵消效率的提高,并維持當(dāng)前的人工智能基礎(chǔ)設(shè)施投資水平。
培訓(xùn)
5大催化劑將維持對(duì)培訓(xùn)計(jì)算的強(qiáng)勁需求,抵消效率的提高
繼續(xù)推動(dòng)“曼哈頓計(jì)劃”的科學(xué)應(yīng)用案例(如研究突破、新藥發(fā)現(xiàn)等)
盡管后幾代模型可以有效降低成本,但首次訓(xùn)練下一代大型模型的成本仍然很高
競(jìng)爭(zhēng)加劇和人工智能軍備競(jìng)賽,尤其是針對(duì)開(kāi)源模型,但也針對(duì)前沿專有模型
用于新模式(如音頻、視頻、機(jī)器人與文本)的訓(xùn)練數(shù)據(jù)/參數(shù)數(shù)量不斷增加,生成的合成數(shù)據(jù)也在增加
增加政府贊助(如星際之門(mén))和支持性法規(guī),促進(jìn)人工智能的持續(xù)研發(fā)
推理
推理成本以每年至少10倍的速度持續(xù)下降,對(duì)推理計(jì)算的需求持續(xù)增長(zhǎng)
通過(guò)企業(yè)生成式人工智能用例部署(如代碼生成),終端用戶的采用率不斷提高,橫向工具(如Perplexity、ChatGPT)的日常使用率大幅上升
每個(gè)用戶使用更多推理繁重的大型語(yǔ)言模型功能(如視頻生成),以及在數(shù)十億設(shè)備(如手機(jī)、物聯(lián)網(wǎng)傳感器)上進(jìn)行大規(guī)模推理的邊緣擴(kuò)散,人工智能的使用強(qiáng)度將會(huì)增加
可能的人工智能市場(chǎng)情景
DeepSeek 的影響可能會(huì)以多種方式展開(kāi)。
在看漲的情況下,效率的不斷提高將導(dǎo)致推理成本的降低,從而刺激更多的人工智能應(yīng)用——這種模式被稱為杰文悖論(Jevon's paradox),即成本降低推動(dòng)需求增加。在推理成本下降的同時(shí),高端培訓(xùn)和先進(jìn)的人工智能模型可能會(huì)繼續(xù)成為大量投資的理由,從而確保在尖端人工智能能力方面的支出保持強(qiáng)勁。
適度情景表明,人工智能培訓(xùn)成本保持穩(wěn)定,但人工智能推理基礎(chǔ)設(shè)施支出將減少30%至50%。在這種情況下,云服務(wù)提供商的資本支出將從每年800億至1000億美元之間減少到650億至850億美元之間,雖然低于目前的預(yù)測(cè),但仍比2023年的水平增加了2至3倍。
在看跌的情況下,人工智能培訓(xùn)預(yù)算縮減,推理基礎(chǔ)設(shè)施支出大幅下降。云提供商的資本支出可能降至400 億至600億美元之間,雖然低于目前的預(yù)測(cè),但仍比2023年的水平高出1.5倍至2倍。
消除噪音
在各種猜測(cè)中,一些看法可能有助于了解事件的來(lái)龍去脈:
重大飛躍,不足為奇:推理成本一直在穩(wěn)步下降,DeepSeek的創(chuàng)新加速了這一趨勢(shì),而非完全顛覆。
不要反應(yīng)過(guò)度:人工智能的應(yīng)用將繼續(xù)強(qiáng)勁擴(kuò)張,盡管投資的速度和形式可能會(huì)發(fā)生變化。
推理只是其中的一部分:最大的參與者仍在競(jìng)相建立下一代模型,以開(kāi)啟前沿應(yīng)用和更大的潛在市場(chǎng)。
各細(xì)分市場(chǎng)的影響:模型層的軍備競(jìng)賽愈演愈烈,開(kāi)源與專有的較量成為關(guān)鍵戰(zhàn)場(chǎng),數(shù)據(jù)中心硬件的短期波動(dòng)和中期走強(qiáng)將使應(yīng)用程序廠商受益。
能源需求:鑒于電力供應(yīng)的限制,到2030年的近期需求不太可能發(fā)生實(shí)質(zhì)性變化;長(zhǎng)期影響仍不確定。
總體而言,對(duì)人工智能能力的需求依然強(qiáng)勁。隨著效率的提高,數(shù)據(jù)中心、硬件提供商和人工智能應(yīng)用程序開(kāi)發(fā)人員將繼續(xù)發(fā)展,創(chuàng)造新的可能性。
首席執(zhí)行官手冊(cè):現(xiàn)在該做什么
對(duì)于首席執(zhí)行官們來(lái)說(shuō),DeepSeek事件與其說(shuō)是一家公司的事,不如說(shuō)是人工智能未來(lái)的信號(hào)。教訓(xùn)是顯而易見(jiàn)的:人工智能創(chuàng)新的步伐是快速和迭代的,突破可能來(lái)自意想不到的地方。
高管們可以采取三個(gè)關(guān)鍵步驟:
避免過(guò)度反應(yīng),但要做好成本擾動(dòng)的準(zhǔn)備。DeepSeek的模型可能不會(huì)對(duì)人工智能企業(yè)的生存構(gòu)成威脅,但它凸顯了人工智能成本的快速下降。企業(yè)應(yīng)為人工智能推理成本大幅降低的世界做好準(zhǔn)備,從而實(shí)現(xiàn)更廣泛的應(yīng)用和新的競(jìng)爭(zhēng)態(tài)勢(shì)。
密切關(guān)注市場(chǎng)信號(hào)。密切關(guān)注資本支出趨勢(shì)、GPU需求和人工智能采用率。如果基礎(chǔ)設(shè)施支出放緩,可能表明效率的提高正在重塑人工智能經(jīng)濟(jì)學(xué) 。隨著企業(yè)加速采用人工智能,企業(yè)必須迅速采取行動(dòng),將人工智能融入其核心戰(zhàn)略。
超越生產(chǎn)力——將人工智能視為商業(yè)模式的催化劑。人工智能的真正贏家將是那些利用人工智能重新定義其核心產(chǎn)品而不僅僅是削減成本的企業(yè)。首席執(zhí)行官們應(yīng)該推動(dòng)企業(yè)超越自動(dòng)化,實(shí)現(xiàn)人工智能驅(qū)動(dòng)的創(chuàng)新——無(wú)論是在產(chǎn)品開(kāi)發(fā)、客戶個(gè)性化還是全新服務(wù)方面。
未來(lái)幾個(gè)月需要關(guān)注的重要信號(hào)
影響較小的跡象
圍繞成本和利用其他模式(如OpenAI)的理論得到證實(shí)
揭示重要的“隱藏”成本或資源(如GPU)暴露
有明顯證據(jù)表明,DeepSeek是在其他模型上訓(xùn)練出來(lái)的
人工智能市場(chǎng)繼續(xù)關(guān)注前沿/更先進(jìn)的訓(xùn)練模型
DeepSeek努力在中國(guó)以外地區(qū)獲得相關(guān)性
衍生模型和競(jìng)爭(zhēng)者的快速增長(zhǎng)
低成本開(kāi)源模型日益普及,使人工智能推理能更快地適應(yīng)產(chǎn)品市場(chǎng)需求
新進(jìn)入者迅速使該領(lǐng)域商品化
隨著成本下降,人工智能工具被迅速采用
企業(yè)人工智能對(duì)高端高性能機(jī)型的需求依然強(qiáng)勁;領(lǐng)先的人工智能實(shí)驗(yàn)室實(shí)施人工智能模型訪問(wèn)限制和提煉控制。
市場(chǎng)軌跡發(fā)生重大變化的跡象
數(shù)據(jù)中心和云計(jì)算人工智能支出放緩
主要云服務(wù)提供商推遲或縮減人工智能基礎(chǔ)設(shè)施擴(kuò)張計(jì)劃
人工智能初創(chuàng)企業(yè)縮減圖形處理器(GPU)訂單或云人工智能合同
半導(dǎo)體需求疲軟
主要企業(yè)(Nvidia、AMD、臺(tái)積電等)下調(diào)與人工智能相關(guān)的收益和資本支出
GPU前置時(shí)間縮短;高端芯片二級(jí)市場(chǎng)定價(jià)下降
人工智能驅(qū)動(dòng)的電力需求放緩
云提供商下調(diào)耗電量預(yù)測(cè)
能源供應(yīng)商報(bào)告直流電增長(zhǎng)低于預(yù)期
在非西方市場(chǎng),企業(yè)采用的人工智能模式已從美國(guó)供應(yīng)商轉(zhuǎn)向其他國(guó)家和地區(qū);
美國(guó)對(duì)人工智能芯片出口發(fā)布新限制,和/或中國(guó)要求采用國(guó)產(chǎn)機(jī)型;
前沿模型要么“退出”,因?yàn)樗鼈兺ㄟ^(guò)提煉失去了價(jià)值,要么大大提高了效率;
編輯 | Jinya
清流學(xué)苑2025Q1課程安排
我們將在3月1~2日在北京再次推出我們清流學(xué)苑的經(jīng)典課程《問(wèn)題解決營(yíng)》的升級(jí)版,歡迎感興趣的朋友掃碼了解和報(bào)名。
我們也將在3月29~30日在上海推出我們的清流學(xué)苑的新晉課程《關(guān)鍵洞察營(yíng)》,歡迎感興趣的朋友掃碼了解和報(bào)名。
常言道“不出正月都是年”,因此慎思行年度經(jīng)典文章大禮包活動(dòng)將持續(xù)至正月正式結(jié)束,歡迎大家掃碼填問(wèn)卷,獲取大禮包。
進(jìn)一步交流
進(jìn)入專業(yè)社群展開(kāi)深度討論
慎思行通過(guò)微信等平臺(tái)覆蓋超過(guò)10萬(wàn)戰(zhàn)略人、咨詢?nèi)说雀黝悓I(yè)人士。我們也構(gòu)建了專業(yè)社群,推動(dòng)戰(zhàn)略與咨詢領(lǐng)域的問(wèn)題討論、信息交流和機(jī)會(huì)分享,社群已有超過(guò)5年歷史,并成為了頂尖專業(yè)人士感知市場(chǎng)前沿,獲得實(shí)踐經(jīng)驗(yàn)的首要選擇。入群請(qǐng)?zhí)砑由魉季⑿牛⑻峁┟?/p>
現(xiàn)在微信公眾號(hào)更改規(guī)則,如果你不特地點(diǎn)進(jìn)來(lái),很可能看不到我們的推送了。希望喜歡【慎思行】的讀者朋友們將本號(hào)【設(shè)為星標(biāo)★】,方便找到我們;也歡迎點(diǎn)擊右下角的【在看】。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.