網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

穿過(guò)DeepSeek的窄門

2025-05-07 08:16:03　來(lái)源: 中國(guó)企業(yè)家雜志

北京舉報(bào)

分享至

尤洋想知道，梁文鋒的目標(biāo)到底是什么。

文｜《中國(guó)企業(yè)家》記者閆俊文

編輯｜張曉迪

頭圖來(lái)源｜受訪者

DeepSeek成了熱門概念，握住它，仿佛就掌握了財(cái)富之門的密鑰。

騰訊、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬，得益于DeepSeek概念，騰訊股價(jià)一度漲超6%，達(dá)到506港元，創(chuàng)下近三年的新高。另一些服務(wù)器和初創(chuàng)公司也借此造勢(shì)，或出售一體機(jī)，或售賣token，發(fā)了一筆熱財(cái)。

一時(shí)間，追隨者如過(guò)江之鯽，DeepSeek成了“寬門”，人人都希望通過(guò)它來(lái)掘金。但偏偏有人例外，要過(guò)“窄門”，不跟著DeepSeek的節(jié)奏走。

3月1日，一家名為潞晨科技的AI Infra初創(chuàng)公司發(fā)布公告，“潞晨云將在一周后停止提供DeepSeek API服務(wù)，請(qǐng)盡快用完您的余額。如果沒用完，我們?nèi)~退款。”這個(gè)公告距離它在2月4日上線這項(xiàng)業(yè)務(wù)還不足一個(gè)月。

快速接入，而后快速停止，根源是售賣DeepSeek等開源模型API token的MaaS業(yè)務(wù)模式帶來(lái)了虧損。

2月9日，潞晨科技創(chuàng)始人尤洋在微博上“掰指頭”算賬，阿里云、百度云、騰訊云等內(nèi)卷低價(jià)或免費(fèi)提供服務(wù)，滿血版的DeepSeek-R1每百萬(wàn)token官方也只能收到16元，如果滿血版的DeepSeek-R1每日輸出1000億token，每月收入約為4500萬(wàn)元，但每月的機(jī)器成本是4.5億元，虧損4億元！用戶越多，虧損越多，尤洋得出結(jié)論，MaaS（Model as a Service）在中國(guó)短時(shí)間內(nèi)可能是最差的商業(yè)模式。

這種觀點(diǎn)引發(fā)了熱議。在知乎上，尤洋給出自己的算賬過(guò)程，但一部分網(wǎng)友認(rèn)為他將問題無(wú)限拔高，直言其否定了DeepSeek。

3月1日中午，DeepSeek在知乎發(fā)表的一篇名為《DeepSeek-V3/R1推理系統(tǒng)概覽》的文章提到，理論上一天的總收入為56萬(wàn)美元，成本利潤(rùn)率 545%。

但尤洋仍堅(jiān)持自己的觀點(diǎn)，并列舉了三大理由：1.測(cè)試速度和實(shí)際場(chǎng)景的差距；2.機(jī)器利用率峰值和波谷的巨大差距；3.機(jī)器的不穩(wěn)定性。他感嘆，有點(diǎn)不太想深入討論，因?yàn)楹芏嗳松踔料氘?dāng)然地把“DeepSeek不虧錢”當(dāng)成一種不能撼動(dòng)的真理。

3月1日下午，潞晨科技宣布暫停DeepSeek API服務(wù)。

3月底和4月底，《中國(guó)企業(yè)家》兩次采訪尤洋。他是一位90后，戴著眼鏡，身材瘦削，不善言談，與他在網(wǎng)絡(luò)上“火力全出”的形象截然不同。

事實(shí)上，尤洋要穿過(guò)三重“窄門”，一個(gè)是大家都在擁抱售賣DeepSeek等開源模型的API服務(wù)，但尤洋拒絕；另一個(gè)則是他堅(jiān)定選擇與華為昇騰等國(guó)產(chǎn)算力廠商合作，大部分人還在等待美國(guó)政府對(duì)英偉達(dá)H20芯片的寬限令；最后，他押注視頻大模型，這與文本模型的熱鬧形成了反差。

“視頻大模型是AI時(shí)代的相機(jī)。”尤洋說(shuō)，潞晨開源的視頻模型Open-Sora 2.0，近期榮登GitHub Trending全球開源熱度榜單第一，以此為基礎(chǔ)的AI視頻生成平臺(tái)Video Ocean，僅需用戶提供一句話描述，即可在線生成高質(zhì)量動(dòng)態(tài)視頻，發(fā)布后登上Product Hunt全球產(chǎn)品熱度榜單第一。

尤洋履歷頗豐，本科畢業(yè)后，他先在清華大學(xué)攻讀碩士研究生，后赴美國(guó)加州大學(xué)伯克利分校深造，獲得博士學(xué)位后，任新加坡國(guó)立大學(xué)高性能人工智能實(shí)驗(yàn)室主任、校長(zhǎng)青年教授；2021年，尤洋受投資人邀請(qǐng)，在北京創(chuàng)立了潞晨科技，迄今已獲得創(chuàng)新工場(chǎng)、真格基金、紅杉中國(guó)、藍(lán)馳創(chuàng)投、北京市AI產(chǎn)業(yè)投資基金等投資機(jī)構(gòu)的數(shù)輪融資。

來(lái)源：受訪者

目前，潞晨科技在北京和新加坡等地有近80人的團(tuán)隊(duì)，根據(jù)2024年披露的數(shù)據(jù)，該公司合同營(yíng)收7700萬(wàn)元人民幣，賬面上有能滿足30個(gè)月開支的現(xiàn)金流。

以下是對(duì)話的內(nèi)容實(shí)錄（有刪減）：

放棄DeepSeek API服務(wù)，最主要原因是虧損

《中國(guó)企業(yè)家》：你們?cè)?月和3月遭遇的網(wǎng)絡(luò)風(fēng)波，現(xiàn)在已經(jīng)過(guò)去了嗎？

尤洋：對(duì)我們來(lái)說(shuō)，其實(shí)一直沒有什么影響，我個(gè)人也沒有去與DeepSeek對(duì)立的想法。

《中國(guó)企業(yè)家》：現(xiàn)在外界對(duì)技術(shù)與商業(yè)模式的討論，各種各樣的說(shuō)法都有。

尤洋：在知乎上或者其他地方攻擊我的那些人，我敢負(fù)責(zé)任地說(shuō)，這些人里99%從來(lái)沒有用300多張卡去真正部署過(guò)DeepSeek，甚至沒用100張卡部署過(guò)。僅去跟風(fēng)想象一件事情，和實(shí)際動(dòng)手驗(yàn)證，得到的觀察是截然不同的。

我確實(shí)親手驗(yàn)證過(guò)這件事情，如果是業(yè)界專家看，我的觀點(diǎn)跟DeepSeek發(fā)布的數(shù)據(jù)，是沒有任何沖突的。

《中國(guó)企業(yè)家》：但DeepSeek說(shuō)自己的成本利潤(rùn)率是545%，而你在微博上說(shuō)MaaS模式下，毛利率是-700%。

尤洋：首先，DeepSeek原文中說(shuō)了，這是理論數(shù)字。沒有考慮用戶的體驗(yàn)和商業(yè)服務(wù)的可用性保障，并且他把那些APP以及網(wǎng)頁(yè)和MaaS上的token都加在一起計(jì)算了收入，但顯然很多是大家可以免費(fèi)使用的。

春節(jié)的時(shí)候，我感覺DeepSeek的熱度有點(diǎn)過(guò)于瘋狂了。它還在非理性市場(chǎng)，一旦變得市場(chǎng)化，需求側(cè)變得不穩(wěn)定和高要求，那么它的測(cè)算還會(huì)有非常大的波動(dòng)。

《中國(guó)企業(yè)家》：您微博上所說(shuō)的數(shù)據(jù)，比方說(shuō)收入4500萬(wàn)元，機(jī)器成本3.6億元，毛利率-700%，這個(gè)結(jié)論是你們自己跑出來(lái)的？

尤洋：根據(jù)微博上另一位博主在AMD機(jī)器上的實(shí)測(cè)換算得到。補(bǔ)充一個(gè)例子，Hugging Face中國(guó)區(qū)的一位資深專家在朋友圈發(fā)圖，他把卡的性能發(fā)揮到極致，燒了一下午的token，也沒有燒夠100萬(wàn)個(gè)，當(dāng)然他用的卡可能是低配版?？紤]到服務(wù)全國(guó)用戶，可能全國(guó)有5000萬(wàn)人在用，大多數(shù)人每天可能就用一兩個(gè)小時(shí)。但因?yàn)槲覀儾荒軠?zhǔn)確預(yù)測(cè)哪些用戶要用多少，什么時(shí)候用，同時(shí)為了容納高峰保障MaaS服務(wù)的商業(yè)穩(wěn)定，機(jī)器要能容納最高峰，低谷還是得放著，成本還是高峰那么多。

我的算力不管是租還是自建，算力成本都是隨時(shí)間穩(wěn)定產(chǎn)生的，推理與訓(xùn)練需求的服務(wù)器也不一樣，這得放多少服務(wù)器，可能需要數(shù)萬(wàn)臺(tái)H20等推理服務(wù)器時(shí)刻運(yùn)轉(zhuǎn)。比如大家不能接受微信在高峰時(shí)段不可用和三天兩頭崩掉。類似的，作為MaaS供應(yīng)商，下游商業(yè)應(yīng)用和C端用戶也需要有體驗(yàn)和服務(wù)的可用性保障。

《中國(guó)企業(yè)家》：速度是指token的輸出速度嗎？

尤洋：賺還是虧，核心的指標(biāo)就是一臺(tái)GPU每秒能出多少token，以及對(duì)應(yīng)的成本。比如它究竟是一秒鐘輸出了1000個(gè)token還是10000個(gè)token，因?yàn)樗罱K是按照token的價(jià)格去賣的。

來(lái)源：AI生成

《中國(guó)企業(yè)家》：公司在2月初上線了DeepSeek的API服務(wù)，但經(jīng)過(guò)一個(gè)月的嘗試，決定不做這個(gè)業(yè)務(wù)，這是為什么？

尤洋：如果不嘗試的話，我感覺沒有發(fā)言權(quán)的。其他初創(chuàng)公司可能會(huì)覺得，前幾個(gè)月我燒一下，然后過(guò)幾個(gè)月再堅(jiān)持一下，跑不通了，我再把它砍掉，但是我們可能就直接過(guò)了不到一個(gè)月的時(shí)間就把它砍掉了。

《中國(guó)企業(yè)家》：為什么決斷這么迅速？

尤洋：有兩個(gè)原因，第一，我們海外的潞晨云業(yè)務(wù)增長(zhǎng)比較快，我們應(yīng)該把資金投入到非常難得的增長(zhǎng)機(jī)會(huì)里；第二，MaaS的商業(yè)模式還不太成熟就已陷入內(nèi)卷，現(xiàn)在中國(guó)至少有50個(gè)云廠商都在提供開源的DeepSeek模型API服務(wù)，它已經(jīng)不是一個(gè)稀缺的東西了，現(xiàn)在部署起來(lái)也比較成熟，利潤(rùn)空間非常有限。

根據(jù)IDC數(shù)據(jù)，TOP3公有云已占據(jù)MaaS 85%市場(chǎng)份額，截至2024年底，MaaS全國(guó)用量10000億token/天。以較貴的DeepSeek-V3刊例價(jià)計(jì)算，該業(yè)務(wù)全國(guó)全年市場(chǎng)總計(jì)營(yíng)收期望值為：10000億token/天×8元/百萬(wàn)token×365天=29.2億元。但實(shí)際上，為搶占市場(chǎng)，有大量免費(fèi)和低價(jià)token，不計(jì)成本惡性競(jìng)爭(zhēng)，遠(yuǎn)達(dá)不到上述營(yíng)收期望。

《中國(guó)企業(yè)家》：公司公告里也說(shuō)了“暫?！?，你也說(shuō)MaaS暫時(shí)是中國(guó)最差的商業(yè)模式，什么時(shí)候會(huì)再次嘗試？

尤洋：我們非常靈活，只要它符合市場(chǎng)，并且能產(chǎn)生一定的利潤(rùn)，不管用何種方式，只要它能產(chǎn)生健康的利潤(rùn)，我覺得應(yīng)該去做。

《中國(guó)企業(yè)家》：初創(chuàng)公司很少提利潤(rùn)，一般都是先做規(guī)模，擴(kuò)大市場(chǎng)份額。

尤洋：可能不一定公司需要盈利，但是至少這個(gè)生意邏輯應(yīng)該是跑得通的，我的單位經(jīng)濟(jì)模型到底是什么？長(zhǎng)期來(lái)看，它如何產(chǎn)生價(jià)值，我覺得產(chǎn)生利潤(rùn)就是一個(gè)企業(yè)應(yīng)該追求的東西。

《中國(guó)企業(yè)家》：作為一個(gè)創(chuàng)業(yè)者，你怎么看Kimi和DeepSeek這樣的明星公司？

尤洋：我感覺都有點(diǎn)可遇而不可求。根據(jù)楊植麟的自述，在2023年但凡晚個(gè)幾周，他可能就達(dá)不到他今天的壯舉，他的融資窗口只有一個(gè)月，當(dāng)然，他本身也有張予彤（前金沙江創(chuàng)投主管合伙人）的加持，這種機(jī)會(huì)難得，可遇而不可求，DeepSeek背后的幻方量化資金非常雄厚，較早就有萬(wàn)卡集群了。

這兩者的情況其實(shí)不像是創(chuàng)業(yè)，他們本身就已經(jīng)家大業(yè)大了，更像在運(yùn)營(yíng)一個(gè)阿里或者谷歌的研發(fā)中心，而不是一般創(chuàng)業(yè)者的模式。

《中國(guó)企業(yè)家》：MaaS模式之下，就沒有獲益的公司？

尤洋：MaaS對(duì)OpenAI來(lái)說(shuō)是一個(gè)很好的商業(yè)模式。我始終覺得AI最終應(yīng)該形成兩三家企業(yè)，兩三家有絕對(duì)實(shí)力的企業(yè)進(jìn)行必然（適度）的壟斷，而不是一家。比如中國(guó)有三家，這三家的模型非常好，它可以像OpenAI那樣去閉源，做成MaaS并獲得合理收益。

現(xiàn)在MaaS商業(yè)模式之所以不好，是因?yàn)榇蠖际褂瞄_源模型或者沒有拉開差距的閉源模型，各家沒有本質(zhì)不同，為了搶占市場(chǎng)，只能打價(jià)格戰(zhàn)和免費(fèi)惡性競(jìng)爭(zhēng)，但成本是根據(jù)GPU固定產(chǎn)生的。

初創(chuàng)公司的商業(yè)模式是什么？

《中國(guó)企業(yè)家》：你在微博上引用紅杉資本合伙人周逵的話，尋找“難而正確的事”并沉下心來(lái)去做，什么是正確的事？

尤洋：但凡是高價(jià)值的東西，肯定會(huì)有很多人想去做。因?yàn)樗懈邇r(jià)值，肯定也不會(huì)那么簡(jiǎn)單，首先每個(gè)人都選一個(gè)自己相信的點(diǎn)，比如我相信未來(lái)就是算力平臺(tái)，加上視頻大模型，這兩個(gè)生意是有光明前景的。

《中國(guó)企業(yè)家》：潞晨的商業(yè)模式是什么？

尤洋：第一，幫助企業(yè)去做自己的AI大模型，比如企業(yè)自有模型、行業(yè)模型，我們面向一些中小型客戶以及傳統(tǒng)客戶，在海外就是潞晨云，國(guó)內(nèi)就是一體機(jī)，這是我們一直在做的事情；第二，我們最近特別關(guān)注視頻大模型，視頻大模型未來(lái)就是AI的相機(jī)。

《中國(guó)企業(yè)家》：視頻大模型為什么是未來(lái)的機(jī)會(huì)？

尤洋：視頻大模型是未來(lái)三年少有的持續(xù)增長(zhǎng)的市場(chǎng)，關(guān)鍵是視頻大模型它有兩點(diǎn)，第一，它對(duì)算力的需求優(yōu)化極高，一個(gè)很小的視頻可能都有幾百萬(wàn)token，視頻大模型未來(lái)的三五年核心就是算力優(yōu)化，這是最重要的事情。

來(lái)源：AI生成

第二，視頻大模型產(chǎn)品形態(tài)很有可能會(huì)變成一個(gè)算力優(yōu)化的工作，它跟大語(yǔ)言模型的核心區(qū)別是，大語(yǔ)言模型是需要實(shí)時(shí)交互的，比如說(shuō)我用ChatGPT或者DeepSeek，如果我問它一個(gè)問題，它過(guò)兩三分鐘才回復(fù)，甚至超過(guò)20秒回復(fù)，我就沒有耐心了。

但視頻大模型我提交一個(gè)任務(wù)，比如，我讓它生成一個(gè)電影，生成一個(gè)短視頻，我是可以等的。

《中國(guó)企業(yè)家》：視頻模型的生意本質(zhì)還是MaaS模式。

尤洋：對(duì)，但它的MaaS商業(yè)上比較友好，即便用戶同時(shí)擠過(guò)來(lái)，可以隊(duì)列式處理請(qǐng)求。

《中國(guó)企業(yè)家》：在云上，訓(xùn)練一個(gè)中小企業(yè)自己專屬的模型的話，大概成本是多少錢？

尤洋：大概是3萬(wàn)元/月，當(dāng)然有的可能需求高一點(diǎn)也可以，也有些企業(yè)花了幾百萬(wàn)。在海外，我們大概每月有100萬(wàn)美元的收入。

《中國(guó)企業(yè)家》：有廠商已經(jīng)把一體機(jī)的價(jià)格賣到了14萬(wàn)元左右，你們的一體機(jī)價(jià)格在數(shù)百萬(wàn)元，差別是什么？

尤洋：如果只是買10萬(wàn)元的一體機(jī)的話，它跑DeepSeek-R1-671B參數(shù)效率不是最高的，也不會(huì)有太好的實(shí)際意義。其實(shí)他們很多是套殼KTransformers這個(gè)開源項(xiàng)目。簡(jiǎn)單做個(gè)性價(jià)比核算：硬件10萬(wàn)元，Q4量化（一種壓縮模型的技術(shù)）的殘血DeepSeek-R1/V3模型輸出能力10token/s，只能供1個(gè)用戶使用，每月滿載理論輸出能力26M token；而從云廠買等量未閹割滿血模型的API token價(jià)值一兩百塊，還有免費(fèi)額度和按量折扣。100多萬(wàn)元的一體機(jī)可以服務(wù)高精度高并發(fā)的商業(yè)需求和簡(jiǎn)單私有模型微調(diào)開發(fā)，顯然實(shí)用很多。

我們還做了Colossal-AI開源，這是全亞洲最大的大模型訓(xùn)練推理的平臺(tái)系統(tǒng)，僅就開發(fā)工具而言，我們?cè)趦?yōu)化方面積累還是非常深的，收獲了5個(gè)世界500強(qiáng)客戶。

華為是個(gè)大機(jī)會(huì)

《中國(guó)企業(yè)家》：現(xiàn)在你們焦慮嗎？畢竟H20受限了。

尤洋：還好，國(guó)內(nèi)沒有H20的話，我們就做國(guó)產(chǎn)芯片，華為昇騰等國(guó)產(chǎn)算力發(fā)展得很快。

《中國(guó)企業(yè)家》：我看到國(guó)外媒體說(shuō)華為要發(fā)新的芯片910C，你們會(huì)覺得有差別嗎？會(huì)對(duì)你們的成本結(jié)構(gòu)有什么影響？

尤洋：差別不大，我們就是想選一個(gè)市場(chǎng)上能買到的最好和最受歡迎的機(jī)器，基于它去做優(yōu)化。其實(shí)我覺得對(duì)我們是更有利的。因?yàn)榧俣▏?guó)產(chǎn)芯片可能暫時(shí)落后英偉達(dá)芯片的話，我們其實(shí)有更多優(yōu)化空間可以做。

《中國(guó)企業(yè)家》：你在微博上也說(shuō)，華為的芯片優(yōu)化不可能靠1~2家小公司搞定。

尤洋：華為有幾千人的團(tuán)隊(duì)與芯片業(yè)務(wù)相關(guān)，華為的芯片肯定是有中流砥柱的作用。我覺得再配合幾十家、上百家公司去協(xié)同華為生態(tài)，這樣比較靠譜，肯定不能靠一兩家小公司去把這個(gè)事情做好。

《中國(guó)企業(yè)家》：目前，國(guó)產(chǎn)芯片相較于英偉達(dá)芯片，主要差距在哪里？

尤洋：一張英偉達(dá)芯片賣多少錢，一張國(guó)產(chǎn)芯片賣多少錢，受限于生產(chǎn)芯片的成本和暫時(shí)的技術(shù)限制，所以（國(guó)內(nèi)）生產(chǎn)同樣性能的芯片成本就高很多，導(dǎo)致必須得這樣定價(jià)，定價(jià)又導(dǎo)致研發(fā)速度跟不上英偉達(dá)。

來(lái)源：AI生成

比如說(shuō)同樣花了1萬(wàn)塊錢，英偉達(dá)能每分鐘出10萬(wàn)個(gè)token，國(guó)產(chǎn)芯片只能出3萬(wàn)或者2萬(wàn)個(gè)token。我覺得華為等已經(jīng)做得很好了，只不過(guò)英偉達(dá)積累的時(shí)間更長(zhǎng)，做了20多年了，飯得一口一口吃。

《中國(guó)企業(yè)家》：在國(guó)產(chǎn)芯片上做優(yōu)化和加速的難點(diǎn)是什么？

尤洋：大模型層，首先DeepSeek的難點(diǎn)是，國(guó)產(chǎn)芯片沒那么穩(wěn)定，它的周邊配套也不是特別好，國(guó)產(chǎn)芯片很多算子缺失，精度、編譯器、集群等又經(jīng)常出bug，導(dǎo)致使用它開發(fā)比較困難，總體上，肯定不是一個(gè)芯片本身跑分高低的問題。

這相當(dāng)于我有一個(gè)賽車，它的設(shè)計(jì)理論速度，比如說(shuō)250公里每小時(shí)，但是我可能要精心嘗試跑100次才能跑出一個(gè)這樣的速度，它還沒那么穩(wěn)定。

《中國(guó)企業(yè)家》：對(duì)于AI Infra企業(yè)來(lái)說(shuō)，是模型進(jìn)化更重要還是加速更重要？

尤洋：其實(shí)兩者并不矛盾，模型的進(jìn)化能帶動(dòng)需求的旺盛，進(jìn)一步帶動(dòng)對(duì)開發(fā)、應(yīng)用模型的信心和投入，提升對(duì)訓(xùn)推加速、算力的需求，進(jìn)而加速模型進(jìn)化。

《中國(guó)企業(yè)家》：如果你有機(jī)會(huì)去見到DeepSeek的梁文鋒，你會(huì)和他討論什么問題？

尤洋：其實(shí)我最關(guān)心的是，他到底是想做一個(gè)成功的商業(yè)化公司，還是想通過(guò)一些其他手段做一些非盈利的事情？想知道一下，他的目標(biāo)到底是什么，因?yàn)閮烧呖隙ú罹嗍欠浅４蟮?。比如說(shuō)OpenAI可能還是想做一個(gè)Google那樣非常高價(jià)值的商業(yè)化公司，我不知道梁文鋒是不是想做中國(guó)AI版的谷歌。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.