知名機(jī)構(gòu)SemiAnalysis 剛剛拋出了一篇“黑文”,回顧DeepSeek R1上線 150多天后的市場(chǎng)與技術(shù)表現(xiàn)。
這份報(bào)告剖析了DeepSeek上市半年來(lái)“高開(kāi)低走”的主因↓
DeepSeek為了維持極低的模型每token價(jià)格同時(shí)節(jié)省算力,犧牲了速度和上下文長(zhǎng)度,體驗(yàn)的下滑導(dǎo)致自家 App、網(wǎng)站用戶(hù)大量流失。
結(jié)果,同行們的用戶(hù)量高速增長(zhǎng),DeepSeek卻一路高開(kāi)低走,相對(duì)掉隊(duì)了,甚至勢(shì)頭還不如那些提供DeepSeek服務(wù)的第三方服務(wù)商。
報(bào)告強(qiáng)調(diào),大模型的競(jìng)爭(zhēng)力,不能只卷低價(jià)(只拼每token價(jià)格)。
模型的競(jìng)爭(zhēng)優(yōu)勢(shì)是由性能、延遲、吞吐、上下文長(zhǎng)度、實(shí)際成本等多維度綜合決定的。
當(dāng)然DeepSeek此舉也是無(wú)奈,他們把有限的算力更多用于內(nèi)部研發(fā),加緊R2的進(jìn)度,而非對(duì)外服務(wù)。
對(duì)于傳聞中的R2因?yàn)樗懔Σ蛔阊悠?,?bào)告認(rèn)為并非如此,延期更多的原因來(lái)自于合規(guī)和安全要求。
并且報(bào)告提到,DeepSeek為華為最新的盤(pán)古模型,提供了技術(shù)支持。
為啥我說(shuō)這報(bào)告是「黑文」?
對(duì)于DeepSeek官方服務(wù)體驗(yàn)差、用戶(hù)量下滑的問(wèn)題,我倒是覺(jué)得這份報(bào)告屬于強(qiáng)行挑刺了,也沒(méi)有黑到點(diǎn)子上。
有多少人現(xiàn)在通過(guò)DeepSeek官網(wǎng)和APP使用DeepSeek呢?市面上提供DeepSeek第三方服務(wù)、嵌入DeepSeek能力的產(chǎn)品,數(shù)不勝數(shù)。
你喜歡的這個(gè)菜,各大飯店都有賣(mài),還可以買(mǎi)凈菜自己燒,完全沒(méi)必要去初創(chuàng)老店嘛,人家老店也不指望開(kāi)店生意掙錢(qián)。你喜歡米其林三星的服務(wù)你就去嘛。
DeepSeek更大的價(jià)值在于它的開(kāi)源,這波操作讓大家可以任何地方部署和使用DeepSeek,官方流量下滑更大的原因在于服務(wù)被分流了。
無(wú)數(shù)第三方推理云平臺(tái)、無(wú)數(shù)私有化部署的一體機(jī)、推理集群,撐起了潑天的流量。
DeepSeek開(kāi)啟了大模型使用的新紀(jì)元,這個(gè)價(jià)值,是報(bào)告中提到的那些閉源領(lǐng)先者(OpenAI、Anthropic、Google們)無(wú)法比擬的。
從這個(gè)角度講,DeepSeek其實(shí)已經(jīng)贏麻了。
以下是報(bào)告中的部分圖表,數(shù)據(jù)還不錯(cuò),簡(jiǎn)單羅列解讀。
畫(huà)面意思:大模型的“吐字”價(jià)格正在雪崩式下跌,自從DeepSeek把天花板砸開(kāi),OpenAI、Anthropic被迫一路跟著降價(jià)。
按:沒(méi)有DeepSeek舍身取義,哪有我們的便宜推理?
此圖也說(shuō)明,推理模型進(jìn)入「高性能+低價(jià)」雙重競(jìng)爭(zhēng)時(shí)代,誰(shuí)算力效率更高、商業(yè)模式更靈活,誰(shuí)就能繼續(xù)往下卷。
畫(huà)面意思:AI 應(yīng)用整體用戶(hù)在一路猛漲,但 DeepSeek 的熱度高開(kāi)低走,一飛沖天后很快被其它家搶走份額。
按:但是,不要被假象所迷惑,這只統(tǒng)計(jì)了DS官方web和app流量,完全不能反映真實(shí)的市場(chǎng)容量。
畫(huà)面意思:WEB流量,同行都在暴漲,只有 DeepSeek 在跌,人氣“掉隊(duì)”了。
按:還是那句話,黑子總能找到理由,我就問(wèn)你一句,有多少人用DeepSeek去官網(wǎng)的?
畫(huà)面意思:這是各類(lèi)跑DeepSeek的第三方平臺(tái)的對(duì)比表,DeepSeek官方版,又慢又?jǐn)D牙膏;第三方版DeepSeek明顯體驗(yàn)更好;
按:苦了我一個(gè),幸福全村人,這樣的DeepSeek,簡(jiǎn)直活雷鋒!
畫(huà)面意思:圓圈代表了上下文長(zhǎng)度,DeepSeek官方版又慢有?。坏谌桨鍰eepSeek大部分提供更長(zhǎng)的上下文,個(gè)別高價(jià)產(chǎn)品,甚至同價(jià)位產(chǎn)品也提供更好的體驗(yàn)。
按:大家都是跑DeepSeek,同一個(gè)模型在不同云/平臺(tái)上的“調(diào)教”差距巨大。
我自營(yíng)店就是打個(gè)樣,提供預(yù)制菜。其他店怎么干,看運(yùn)營(yíng)KPI就好。
畫(huà)面意思:這張圖比較的是在有效回答問(wèn)題的時(shí)候,誰(shuí)更省tokens,回答越精煉、推理效率越高。
這方面,DeepSeek R1雖然性能不錯(cuò),但是廢話太多,嘴太碎,行業(yè)趨勢(shì)是向Claude4這種“人狠話不多”的方向發(fā)展。
按:這確實(shí)是個(gè)問(wèn)題,我也覺(jué)得DeepSeek嘴貧還還油膩。
畫(huà)面意思:最新推理模型性能測(cè)評(píng),OpenAI o3 繼續(xù)穩(wěn)坐第一,DeepSeek 新版進(jìn)步明顯,Anthropic 這次沒(méi)跟上。
在這張柱狀圖里,「Aider Benchmark 得分」是指 模型在這套 Aider 真實(shí)編程任務(wù)里的完成率,分?jǐn)?shù)高說(shuō)明「寫(xiě)(改)真代碼」更靠譜。
按:咱不比官方服務(wù),看模型本身能力,DeepSeek就還相當(dāng)不錯(cuò)。
畫(huà)面意思:跟上一張類(lèi)似,這張比價(jià)格,同樣的編程推理成績(jī),OpenAI o1要燒186美元,DeepSeek 新版只要5美元,性?xún)r(jià)比直接差了30倍以上。
按:咱還沒(méi)說(shuō)私有化部署的事呢,放在家里買(mǎi)斷了隨便跑!
好了,不說(shuō)了。
讓我們一起期待DeepSeek R2的到來(lái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.