99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek在改變?nèi)斯ぶ悄苄实挠螒蛞?guī)則?

0
分享至



文章作者丨貝恩公司:Peter Hanbury and Jue Wang,慎思行采編翻譯

個(gè)人微信丨hello_SSX

成立于2023年的中國(guó)人工智能初創(chuàng)公司DeepSeek在業(yè)內(nèi)迅速掀起了波瀾。這家員工不到200人的公司得到了量化基金幻方量化(管理著80億美元資產(chǎn))的支持,在OpenAI宣布價(jià)值5000億美元的星際之門(mén)項(xiàng)目的前一天,該公司發(fā)布了其開(kāi)源模型DeepSeek R1。

DeepSeek的與眾不同之處在于其極具成本效益的前景。該公司聲稱,使用2,000個(gè)Nvidia H800圖形處理器(GPU)訓(xùn)練模型的成本僅為600萬(wàn)美元,而GPT-4的成本為8,000萬(wàn)至1億美元,Meta的LLaMA 3需要16,000個(gè)H100 GPU。雖然這種比較相差甚遠(yuǎn),但理解其中的可能性是有價(jià)值的。

DeepSeek的迅速普及凸顯了其潛在的影響力。短短幾天內(nèi),它就成為美國(guó)應(yīng)用商店中最受歡迎的免費(fèi)應(yīng)用,催生了700多個(gè)開(kāi)源衍生產(chǎn)品(而且還在不斷增加),并被微軟、AWS和Nvidia AI平臺(tái)采用。

DeepSeek的性能似乎是建立在一系列工程創(chuàng)新的基礎(chǔ)上,這些創(chuàng)新大大降低了推理成本,同時(shí)也提高了訓(xùn)練成本。其mixture-of-experts(MoE)架構(gòu)在處理每個(gè)標(biāo)記時(shí)只激活6710億個(gè)參數(shù)中的370億個(gè),在不犧牲性能的情況下減少了計(jì)算開(kāi)銷。公司還優(yōu)化了提煉技術(shù),允許將大型模型的推理能力轉(zhuǎn)移到小型模型中。通過(guò)使用強(qiáng)化學(xué)習(xí),DeepSeek無(wú)需進(jìn)行大量的監(jiān)督微調(diào)即可提高性能。此外,它的多頭潛在注意力(MHLA)機(jī)制將內(nèi)存使用率降低到了5%,而以前的方法只有13%。

除了模型架構(gòu),DeepSeek還改進(jìn)了數(shù)據(jù)處理方式。它采用FP8混合精度的混合/低精度計(jì)算方法,降低了計(jì)算成本。優(yōu)化的獎(jiǎng)勵(lì)函數(shù)可確保計(jì)算能力分配給高價(jià)值的訓(xùn)練數(shù)據(jù),避免在冗余信息上浪費(fèi)資源。公司還采用了稀疏性技術(shù),使模型能夠預(yù)測(cè)特定輸入所需的參數(shù),從而提高速度和效率。DeepSeek的硬件和系統(tǒng)級(jí)優(yōu)化進(jìn)一步提高了性能。公司開(kāi)發(fā)了內(nèi)存壓縮和負(fù)載平衡技術(shù),以最大限度地提高效率。具體來(lái)說(shuō),一種新穎的優(yōu)化技術(shù)是使用PTX編程而不是CUDA,從而使DeepSeek工程師能夠更好地控制GPU指令的執(zhí)行,提高GPU的使用效率。此外,DeepSeek還利用DualPipe算法改進(jìn)了GPU之間的通信,使GPU能夠在訓(xùn)練過(guò)程中更有效地進(jìn)行通信和計(jì)算。

到目前為止,這些結(jié)果并不令人驚訝;事實(shí)上,它們與人工智能效率的大趨勢(shì)相吻合(見(jiàn)圖1)。更令人驚訝的是,一家開(kāi)源的中國(guó)初創(chuàng)公司已經(jīng)設(shè)法縮小或至少顯著縮小了與領(lǐng)先的專有模型之間的性能差距。

圖1

由于創(chuàng)新,人工智能推理成本迅速下降,DeepSeek也順應(yīng)了這一趨勢(shì)


注:大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)衡量大型語(yǔ)言模型(LLM)理解語(yǔ)言和解決問(wèn)題的能力,結(jié)果由模型提供者報(bào)告或通過(guò)外部評(píng)估得出;83分和42分是性能基準(zhǔn),越高越好。

資料來(lái)源:A16Z;貝恩分析

懷疑和市場(chǎng)影響

盡管DeepSeek聲稱如此,但仍存在一些不確定因素。訓(xùn)練模型的真實(shí)成本仍未得到證實(shí),人們猜測(cè)該公司是否混合使用了高端和低端GPU。此外,還有人提出了知識(shí)產(chǎn)權(quán)方面的問(wèn)題,特別是有關(guān)提煉所使用的來(lái)源和方法。一些批評(píng)者認(rèn)為,DeepSeek并沒(méi)有從根本上引入新技術(shù),而只是對(duì)現(xiàn)有技術(shù)進(jìn)行了改進(jìn)。盡管如此,董事會(huì)和領(lǐng)導(dǎo)團(tuán)隊(duì)現(xiàn)在正密切關(guān)注人工智能效率的提高會(huì)如何影響長(zhǎng)期投資計(jì)劃和戰(zhàn)略。

有幾種催化劑可以有效抵消效率的提高,并維持當(dāng)前的人工智能基礎(chǔ)設(shè)施投資水平。

培訓(xùn)

5大催化劑將維持對(duì)培訓(xùn)計(jì)算的強(qiáng)勁需求,抵消效率的提高

  • 繼續(xù)推動(dòng)“曼哈頓計(jì)劃”的科學(xué)應(yīng)用案例(如研究突破、新藥發(fā)現(xiàn)等)

  • 盡管后幾代模型可以有效降低成本,但首次訓(xùn)練下一代大型模型的成本仍然很高

  • 競(jìng)爭(zhēng)加劇和人工智能軍備競(jìng)賽,尤其是針對(duì)開(kāi)源模型,但也針對(duì)前沿專有模型

  • 用于新模式(如音頻、視頻、機(jī)器人與文本)的訓(xùn)練數(shù)據(jù)/參數(shù)數(shù)量不斷增加,生成的合成數(shù)據(jù)也在增加

  • 增加政府贊助(如星際之門(mén))和支持性法規(guī),促進(jìn)人工智能的持續(xù)研發(fā)

推理

推理成本以每年至少10倍的速度持續(xù)下降,對(duì)推理計(jì)算的需求持續(xù)增長(zhǎng)

  • 通過(guò)企業(yè)生成式人工智能用例部署(如代碼生成),終端用戶的采用率不斷提高,橫向工具(如Perplexity、ChatGPT)的日常使用率大幅上升

  • 每個(gè)用戶使用更多推理繁重的大型語(yǔ)言模型功能(如視頻生成),以及在數(shù)十億設(shè)備(如手機(jī)、物聯(lián)網(wǎng)傳感器)上進(jìn)行大規(guī)模推理的邊緣擴(kuò)散,人工智能的使用強(qiáng)度將會(huì)增加

可能的人工智能市場(chǎng)情景

DeepSeek 的影響可能會(huì)以多種方式展開(kāi)。

看漲的情況下,效率的不斷提高將導(dǎo)致推理成本的降低,從而刺激更多的人工智能應(yīng)用——這種模式被稱為杰文悖論(Jevon's paradox),即成本降低推動(dòng)需求增加。在推理成本下降的同時(shí),高端培訓(xùn)和先進(jìn)的人工智能模型可能會(huì)繼續(xù)成為大量投資的理由,從而確保在尖端人工智能能力方面的支出保持強(qiáng)勁。

適度情景表明,人工智能培訓(xùn)成本保持穩(wěn)定,但人工智能推理基礎(chǔ)設(shè)施支出將減少30%至50%。在這種情況下,云服務(wù)提供商的資本支出將從每年800億至1000億美元之間減少到650億至850億美元之間,雖然低于目前的預(yù)測(cè),但仍比2023年的水平增加了2至3倍。

看跌的情況下,人工智能培訓(xùn)預(yù)算縮減,推理基礎(chǔ)設(shè)施支出大幅下降。云提供商的資本支出可能降至400 億至600億美元之間,雖然低于目前的預(yù)測(cè),但仍比2023年的水平高出1.5倍至2倍。

消除噪音

在各種猜測(cè)中,一些看法可能有助于了解事件的來(lái)龍去脈:

  • 重大飛躍,不足為奇:推理成本一直在穩(wěn)步下降,DeepSeek的創(chuàng)新加速了這一趨勢(shì),而非完全顛覆。

  • 不要反應(yīng)過(guò)度:人工智能的應(yīng)用將繼續(xù)強(qiáng)勁擴(kuò)張,盡管投資的速度和形式可能會(huì)發(fā)生變化。

  • 推理只是其中的一部分:最大的參與者仍在競(jìng)相建立下一代模型,以開(kāi)啟前沿應(yīng)用和更大的潛在市場(chǎng)。

  • 各細(xì)分市場(chǎng)的影響:模型層的軍備競(jìng)賽愈演愈烈,開(kāi)源與專有的較量成為關(guān)鍵戰(zhàn)場(chǎng),數(shù)據(jù)中心硬件的短期波動(dòng)和中期走強(qiáng)將使應(yīng)用程序廠商受益。

  • 能源需求:鑒于電力供應(yīng)的限制,到2030年的近期需求不太可能發(fā)生實(shí)質(zhì)性變化;長(zhǎng)期影響仍不確定。

總體而言,對(duì)人工智能能力的需求依然強(qiáng)勁。隨著效率的提高,數(shù)據(jù)中心、硬件提供商和人工智能應(yīng)用程序開(kāi)發(fā)人員將繼續(xù)發(fā)展,創(chuàng)造新的可能性。

首席執(zhí)行官手冊(cè):現(xiàn)在該做什么

對(duì)于首席執(zhí)行官們來(lái)說(shuō),DeepSeek事件與其說(shuō)是一家公司的事,不如說(shuō)是人工智能未來(lái)的信號(hào)。教訓(xùn)是顯而易見(jiàn)的:人工智能創(chuàng)新的步伐是快速和迭代的,突破可能來(lái)自意想不到的地方。

高管們可以采取三個(gè)關(guān)鍵步驟:

避免過(guò)度反應(yīng),但要做好成本擾動(dòng)的準(zhǔn)備。DeepSeek的模型可能不會(huì)對(duì)人工智能企業(yè)的生存構(gòu)成威脅,但它凸顯了人工智能成本的快速下降。企業(yè)應(yīng)為人工智能推理成本大幅降低的世界做好準(zhǔn)備,從而實(shí)現(xiàn)更廣泛的應(yīng)用和新的競(jìng)爭(zhēng)態(tài)勢(shì)。

密切關(guān)注市場(chǎng)信號(hào)。密切關(guān)注資本支出趨勢(shì)、GPU需求和人工智能采用率。如果基礎(chǔ)設(shè)施支出放緩,可能表明效率的提高正在重塑人工智能經(jīng)濟(jì)學(xué) 。隨著企業(yè)加速采用人工智能,企業(yè)必須迅速采取行動(dòng),將人工智能融入其核心戰(zhàn)略。

超越生產(chǎn)力——將人工智能視為商業(yè)模式的催化劑。人工智能的真正贏家將是那些利用人工智能重新定義其核心產(chǎn)品而不僅僅是削減成本的企業(yè)。首席執(zhí)行官們應(yīng)該推動(dòng)企業(yè)超越自動(dòng)化,實(shí)現(xiàn)人工智能驅(qū)動(dòng)的創(chuàng)新——無(wú)論是在產(chǎn)品開(kāi)發(fā)、客戶個(gè)性化還是全新服務(wù)方面。

未來(lái)幾個(gè)月需要關(guān)注的重要信號(hào)

影響較小的跡象

圍繞成本和利用其他模式(如OpenAI)的理論得到證實(shí)

  • 揭示重要的“隱藏”成本或資源(如GPU)暴露

  • 有明顯證據(jù)表明,DeepSeek是在其他模型上訓(xùn)練出來(lái)的

人工智能市場(chǎng)繼續(xù)關(guān)注前沿/更先進(jìn)的訓(xùn)練模型

  • DeepSeek努力在中國(guó)以外地區(qū)獲得相關(guān)性

衍生模型和競(jìng)爭(zhēng)者的快速增長(zhǎng)

  • 低成本開(kāi)源模型日益普及,使人工智能推理能更快地適應(yīng)產(chǎn)品市場(chǎng)需求

  • 新進(jìn)入者迅速使該領(lǐng)域商品化

  • 隨著成本下降,人工智能工具被迅速采用

企業(yè)人工智能對(duì)高端高性能機(jī)型的需求依然強(qiáng)勁;領(lǐng)先的人工智能實(shí)驗(yàn)室實(shí)施人工智能模型訪問(wèn)限制和提煉控制。

市場(chǎng)軌跡發(fā)生重大變化的跡象

數(shù)據(jù)中心和云計(jì)算人工智能支出放緩

  • 主要云服務(wù)提供商推遲或縮減人工智能基礎(chǔ)設(shè)施擴(kuò)張計(jì)劃

  • 人工智能初創(chuàng)企業(yè)縮減圖形處理器(GPU)訂單或云人工智能合同

半導(dǎo)體需求疲軟

  • 主要企業(yè)(Nvidia、AMD、臺(tái)積電等)下調(diào)與人工智能相關(guān)的收益和資本支出

  • GPU前置時(shí)間縮短;高端芯片二級(jí)市場(chǎng)定價(jià)下降

人工智能驅(qū)動(dòng)的電力需求放緩

  • 云提供商下調(diào)耗電量預(yù)測(cè)

  • 能源供應(yīng)商報(bào)告直流電增長(zhǎng)低于預(yù)期

在非西方市場(chǎng),企業(yè)采用的人工智能模式已從美國(guó)供應(yīng)商轉(zhuǎn)向其他國(guó)家和地區(qū);

美國(guó)對(duì)人工智能芯片出口發(fā)布新限制,和/或中國(guó)要求采用國(guó)產(chǎn)機(jī)型;

前沿模型要么“退出”,因?yàn)樗鼈兺ㄟ^(guò)提煉失去了價(jià)值,要么大大提高了效率;

編輯 | Jinya

清流學(xué)苑2025Q1課程安排

我們將在3月1~2日北京再次推出我們清流學(xué)苑的經(jīng)典課程《問(wèn)題解決營(yíng)》的升級(jí)版,歡迎感興趣的朋友掃碼了解和報(bào)名。

我們也將在3月29~30日上海推出我們的清流學(xué)苑的新晉課程《關(guān)鍵洞察營(yíng)》,歡迎感興趣的朋友掃碼了解和報(bào)名。

常言道“不出正月都是年”,因此慎思行年度經(jīng)典文章大禮包活動(dòng)將持續(xù)至正月正式結(jié)束,歡迎大家掃碼填問(wèn)卷,獲取大禮包。

進(jìn)一步交流

進(jìn)入專業(yè)社群展開(kāi)深度討論

慎思行通過(guò)微信等平臺(tái)覆蓋超過(guò)10萬(wàn)戰(zhàn)略人、咨詢?nèi)说雀黝悓I(yè)人士。我們也構(gòu)建了專業(yè)社群,推動(dòng)戰(zhàn)略與咨詢領(lǐng)域的問(wèn)題討論、信息交流和機(jī)會(huì)分享,社群已有超過(guò)5年歷史,并成為了頂尖專業(yè)人士感知市場(chǎng)前沿,獲得實(shí)踐經(jīng)驗(yàn)的首要選擇。入群請(qǐng)?zhí)砑由魉季⑿牛⑻峁┟?/p>

現(xiàn)在微信公眾號(hào)更改規(guī)則,如果你不特地點(diǎn)進(jìn)來(lái),很可能看不到我們的推送了。希望喜歡【慎思行】的讀者朋友們將本號(hào)【設(shè)為星標(biāo)★】,方便找到我們;也歡迎點(diǎn)擊右下角的【在看】。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
李湘與英國(guó)王后卡米拉握手照火了,還穿亮片禮服閃耀晚宴,真貴氣

李湘與英國(guó)王后卡米拉握手照火了,還穿亮片禮服閃耀晚宴,真貴氣

懂體育的小吖頭
2025-05-15 09:14:52
薇婭為女兒慶生照再度翻紅:養(yǎng)出自信的孩子,全靠父母托舉!

薇婭為女兒慶生照再度翻紅:養(yǎng)出自信的孩子,全靠父母托舉!

素衣讀史
2025-05-15 09:59:57
“奧賽金獎(jiǎng)男孩也跳了”,父親祭文誅心,比獨(dú)木橋更難走的是鋼絲

“奧賽金獎(jiǎng)男孩也跳了”,父親祭文誅心,比獨(dú)木橋更難走的是鋼絲

妍妍教育日記
2025-04-10 18:26:43
兩歲半孩子誤食干燥劑,媽媽一邊灌水一邊送醫(yī),醫(yī)生:沒(méi)得治

兩歲半孩子誤食干燥劑,媽媽一邊灌水一邊送醫(yī),醫(yī)生:沒(méi)得治

菁媽育兒
2025-05-15 14:05:43
2025京東618手機(jī)首波銷售榜揭曉:蘋(píng)果三款登頂

2025京東618手機(jī)首波銷售榜揭曉:蘋(píng)果三款登頂

車市生活
2025-05-15 20:00:13
楊天真暴瘦25斤堪比做了次醫(yī)美!比賈玲還嚇人?

楊天真暴瘦25斤堪比做了次醫(yī)美!比賈玲還嚇人?

木子愛(ài)娛樂(lè)大號(hào)
2025-05-15 16:30:05
谷愛(ài)凌《體育畫(huà)報(bào)》寫(xiě)真出爐,剛在勞倫斯紅毯上大放異彩

谷愛(ài)凌《體育畫(huà)報(bào)》寫(xiě)真出爐,剛在勞倫斯紅毯上大放異彩

藝兔體壇
2025-05-15 10:58:41
亮相中超,卡卡執(zhí)教中超?名帥官宣,簽約在即,下家曝光

亮相中超,卡卡執(zhí)教中超?名帥官宣,簽約在即,下家曝光

樂(lè)聊球
2025-05-15 12:29:14
全球市值第一企業(yè)又快易主了

全球市值第一企業(yè)又快易主了

商業(yè)周刊中文版
2025-05-15 15:19:17
歌手2025的座位安排,徹底掀開(kāi)樂(lè)壇的丑態(tài):不管實(shí)力,流量至上!

歌手2025的座位安排,徹底掀開(kāi)樂(lè)壇的丑態(tài):不管實(shí)力,流量至上!

葡萄說(shuō)娛
2025-05-15 15:53:25
曝37歲趙麗穎與趙德胤隱婚,惹馮紹峰媽媽不滿,后援會(huì)回應(yīng)遭群嘲

曝37歲趙麗穎與趙德胤隱婚,惹馮紹峰媽媽不滿,后援會(huì)回應(yīng)遭群嘲

易同學(xué)愛(ài)談娛樂(lè)
2025-05-15 08:20:52
賈玲新片遭集體抵制,“故技重施”連累楊紫:這次準(zhǔn)備撈幾個(gè)億?

賈玲新片遭集體抵制,“故技重施”連累楊紫:這次準(zhǔn)備撈幾個(gè)億?

白面書(shū)誏
2025-05-15 22:13:10
最新!惡心的一幕岀現(xiàn),小賣部老板成冤大頭,孩子已走出核心區(qū)

最新!惡心的一幕岀現(xiàn),小賣部老板成冤大頭,孩子已走出核心區(qū)

說(shuō)說(shuō)史事
2025-05-14 17:41:40
大S生前原生圖曝光,跟具俊曄差距明顯!去世前聊天內(nèi)容太催淚

大S生前原生圖曝光,跟具俊曄差距明顯!去世前聊天內(nèi)容太催淚

TVB的四小花
2025-05-14 14:49:52
天吶,楊天真從230斤瘦到123斤,第二個(gè)賈玲,分享了自己瘦身秘訣

天吶,楊天真從230斤瘦到123斤,第二個(gè)賈玲,分享了自己瘦身秘訣

星光看娛樂(lè)
2025-05-15 13:41:53
四川小伙在美國(guó)農(nóng)村送外賣:早7晚10工作15小時(shí),一天收入3528元

四川小伙在美國(guó)農(nóng)村送外賣:早7晚10工作15小時(shí),一天收入3528元

北緯的咖啡豆
2025-05-14 22:45:02
楊家坪“毒瘤”?第七次流拍!揭示出三大問(wèn)題

楊家坪“毒瘤”?第七次流拍!揭示出三大問(wèn)題

大衛(wèi)聊地產(chǎn)
2025-05-15 16:34:37
傳說(shuō)中749 局九位神秘大佬坐鎮(zhèn),他們分別是誰(shuí)?

傳說(shuō)中749 局九位神秘大佬坐鎮(zhèn),他們分別是誰(shuí)?

爆史君帶你讀歷史
2025-05-12 22:38:50
蘇見(jiàn)信到訪成都蓉城俱樂(lè)部,周定洋送上球衣

蘇見(jiàn)信到訪成都蓉城俱樂(lè)部,周定洋送上球衣

懂球帝
2025-05-15 21:21:10
中美又談崩,48小時(shí)內(nèi)美連發(fā)三道威脅,中方祭出稀土最嚴(yán)管制手段

中美又談崩,48小時(shí)內(nèi)美連發(fā)三道威脅,中方祭出稀土最嚴(yán)管制手段

前沿天地
2025-05-15 16:12:33
2025-05-16 01:00:49
慎思行 incentive-icons
慎思行
定位于管理咨詢與企業(yè)戰(zhàn)略管理
1210文章數(shù) 963關(guān)注度
往期回顧 全部

科技要聞

特朗普施壓庫(kù)克:不希望蘋(píng)果在印度建廠!

頭條要聞

中央軍委決定調(diào)整組建3所軍隊(duì)院校 透露重要信號(hào)

頭條要聞

中央軍委決定調(diào)整組建3所軍隊(duì)院校 透露重要信號(hào)

體育要聞

越過(guò)山丘!鄭欽文:山海皆可平 羅馬站4強(qiáng)

娛樂(lè)要聞

一場(chǎng)戀情瓜暴露了趙麗穎的真實(shí)處境

財(cái)經(jīng)要聞

李強(qiáng):把做強(qiáng)國(guó)內(nèi)大循環(huán)擺到更加突出位置

汽車要聞

下半年上市/預(yù)計(jì)15萬(wàn)元左右 長(zhǎng)安啟源A06官圖發(fā)布

態(tài)度原創(chuàng)

旅游
親子
數(shù)碼
房產(chǎn)
時(shí)尚

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

親子要聞

寶寶濕疹別著急,這份居家護(hù)理與用藥清單請(qǐng)收好

數(shù)碼要聞

BiCS8 TLC 進(jìn)入企業(yè)級(jí)領(lǐng)域,鎧俠發(fā)布 CM9 系列 PCIe 5.0 SSD

房產(chǎn)要聞

三年血虧468萬(wàn)!天河、黃埔網(wǎng)紅盤(pán),跌到底了嗎?

夏天穿錯(cuò)毀所有!6種土味搭配快扔掉,6款質(zhì)感單品讓你顏值飆升

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 马尔康县| 丹凤县| 泊头市| 全州县| 招远市| 科尔| 花莲县| 揭西县| 红桥区| 岳池县| 晋城| 高碑店市| 项城市| 抚州市| 兴义市| 保德县| 福州市| 大渡口区| 图们市| 郁南县| 东方市| 遂溪县| 安岳县| 镇坪县| 马边| 玉树县| 阿瓦提县| 乌兰浩特市| 泾川县| 平罗县| 尖扎县| 个旧市| 沙坪坝区| 阿勒泰市| 岚皋县| 张家界市| 凤冈县| 秦安县| 宿迁市| 聂拉木县| 焦作市|