尤洋想知道,梁文鋒的目標(biāo)到底是什么。
文|《中國(guó)企業(yè)家》記者 閆俊文
編輯|張曉迪
頭圖來(lái)源|受訪者
DeepSeek成了熱門概念,握住它,仿佛就掌握了財(cái)富之門的密鑰。
騰訊、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬,得益于DeepSeek概念,騰訊股價(jià)一度漲超6%,達(dá)到506港元,創(chuàng)下近三年的新高。另一些服務(wù)器和初創(chuàng)公司也借此造勢(shì),或出售一體機(jī),或售賣token,發(fā)了一筆熱財(cái)。
一時(shí)間,追隨者如過(guò)江之鯽,DeepSeek成了“寬門”,人人都希望通過(guò)它來(lái)掘金。但偏偏有人例外,要過(guò)“窄門”,不跟著DeepSeek的節(jié)奏走。
3月1日,一家名為潞晨科技的AI Infra初創(chuàng)公司發(fā)布公告,“潞晨云將在一周后停止提供DeepSeek API服務(wù),請(qǐng)盡快用完您的余額。如果沒用完,我們?nèi)~退款。”這個(gè)公告距離它在2月4日上線這項(xiàng)業(yè)務(wù)還不足一個(gè)月。
快速接入,而后快速停止,根源是售賣DeepSeek等開源模型API token的MaaS業(yè)務(wù)模式帶來(lái)了虧損。
2月9日,潞晨科技創(chuàng)始人尤洋在微博上“掰指頭”算賬,阿里云、百度云、騰訊云等內(nèi)卷低價(jià)或免費(fèi)提供服務(wù),滿血版的DeepSeek-R1每百萬(wàn)token官方也只能收到16元,如果滿血版的DeepSeek-R1每日輸出1000億token,每月收入約為4500萬(wàn)元,但每月的機(jī)器成本是4.5億元,虧損4億元!用戶越多,虧損越多,尤洋得出結(jié)論,MaaS(Model as a Service)在中國(guó)短時(shí)間內(nèi)可能是最差的商業(yè)模式。
這種觀點(diǎn)引發(fā)了熱議。在知乎上,尤洋給出自己的算賬過(guò)程,但一部分網(wǎng)友認(rèn)為他將問題無(wú)限拔高,直言其否定了DeepSeek。
3月1日中午,DeepSeek在知乎發(fā)表的一篇名為《DeepSeek-V3/R1推理系統(tǒng)概覽》的文章提到,理論上一天的總收入為56萬(wàn)美元,成本利潤(rùn)率 545%。
但尤洋仍堅(jiān)持自己的觀點(diǎn),并列舉了三大理由:1.測(cè)試速度和實(shí)際場(chǎng)景的差距;2.機(jī)器利用率峰值和波谷的巨大差距;3.機(jī)器的不穩(wěn)定性。他感嘆,有點(diǎn)不太想深入討論,因?yàn)楹芏嗳松踔料氘?dāng)然地把“DeepSeek不虧錢”當(dāng)成一種不能撼動(dòng)的真理。
3月1日下午,潞晨科技宣布暫停DeepSeek API服務(wù)。
3月底和4月底,《中國(guó)企業(yè)家》兩次采訪尤洋。他是一位90后,戴著眼鏡,身材瘦削,不善言談,與他在網(wǎng)絡(luò)上“火力全出”的形象截然不同。
事實(shí)上,尤洋要穿過(guò)三重“窄門”,一個(gè)是大家都在擁抱售賣DeepSeek等開源模型的API服務(wù),但尤洋拒絕;另一個(gè)則是他堅(jiān)定選擇與華為昇騰等國(guó)產(chǎn)算力廠商合作,大部分人還在等待美國(guó)政府對(duì)英偉達(dá)H20芯片的寬限令;最后,他押注視頻大模型,這與文本模型的熱鬧形成了反差。
“視頻大模型是AI時(shí)代的相機(jī)。”尤洋說(shuō),潞晨開源的視頻模型Open-Sora 2.0,近期榮登GitHub Trending全球開源熱度榜單第一,以此為基礎(chǔ)的AI視頻生成平臺(tái)Video Ocean,僅需用戶提供一句話描述,即可在線生成高質(zhì)量動(dòng)態(tài)視頻,發(fā)布后登上Product Hunt全球產(chǎn)品熱度榜單第一。
尤洋履歷頗豐,本科畢業(yè)后,他先在清華大學(xué)攻讀碩士研究生,后赴美國(guó)加州大學(xué)伯克利分校深造,獲得博士學(xué)位后,任新加坡國(guó)立大學(xué)高性能人工智能實(shí)驗(yàn)室主任、校長(zhǎng)青年教授;2021年,尤洋受投資人邀請(qǐng),在北京創(chuàng)立了潞晨科技,迄今已獲得創(chuàng)新工場(chǎng)、真格基金、紅杉中國(guó)、藍(lán)馳創(chuàng)投、北京市AI產(chǎn)業(yè)投資基金等投資機(jī)構(gòu)的數(shù)輪融資。
來(lái)源:受訪者
目前,潞晨科技在北京和新加坡等地有近80人的團(tuán)隊(duì),根據(jù)2024年披露的數(shù)據(jù),該公司合同營(yíng)收7700萬(wàn)元人民幣,賬面上有能滿足30個(gè)月開支的現(xiàn)金流。
以下是對(duì)話的內(nèi)容實(shí)錄(有刪減):
放棄DeepSeek API服務(wù),最主要原因是虧損
《中國(guó)企業(yè)家》:你們?cè)?月和3月遭遇的網(wǎng)絡(luò)風(fēng)波,現(xiàn)在已經(jīng)過(guò)去了嗎?
尤洋:對(duì)我們來(lái)說(shuō),其實(shí)一直沒有什么影響,我個(gè)人也沒有去與DeepSeek對(duì)立的想法。
《中國(guó)企業(yè)家》:現(xiàn)在外界對(duì)技術(shù)與商業(yè)模式的討論,各種各樣的說(shuō)法都有。
尤洋:在知乎上或者其他地方攻擊我的那些人,我敢負(fù)責(zé)任地說(shuō),這些人里99%從來(lái)沒有用300多張卡去真正部署過(guò)DeepSeek,甚至沒用100張卡部署過(guò)。僅去跟風(fēng)想象一件事情,和實(shí)際動(dòng)手驗(yàn)證,得到的觀察是截然不同的。
我確實(shí)親手驗(yàn)證過(guò)這件事情,如果是業(yè)界專家看,我的觀點(diǎn)跟DeepSeek發(fā)布的數(shù)據(jù),是沒有任何沖突的。
《中國(guó)企業(yè)家》:但DeepSeek說(shuō)自己的成本利潤(rùn)率是545%,而你在微博上說(shuō)MaaS模式下,毛利率是-700%。
尤洋:首先,DeepSeek原文中說(shuō)了,這是理論數(shù)字。沒有考慮用戶的體驗(yàn)和商業(yè)服務(wù)的可用性保障,并且他把那些APP以及網(wǎng)頁(yè)和MaaS上的token都加在一起計(jì)算了收入,但顯然很多是大家可以免費(fèi)使用的。
春節(jié)的時(shí)候,我感覺DeepSeek的熱度有點(diǎn)過(guò)于瘋狂了。它還在非理性市場(chǎng),一旦變得市場(chǎng)化,需求側(cè)變得不穩(wěn)定和高要求,那么它的測(cè)算還會(huì)有非常大的波動(dòng)。
《中國(guó)企業(yè)家》:您微博上所說(shuō)的數(shù)據(jù),比方說(shuō)收入4500萬(wàn)元,機(jī)器成本3.6億元,毛利率-700%,這個(gè)結(jié)論是你們自己跑出來(lái)的?
尤洋:根據(jù)微博上另一位博主在AMD機(jī)器上的實(shí)測(cè)換算得到。補(bǔ)充一個(gè)例子,Hugging Face中國(guó)區(qū)的一位資深專家在朋友圈發(fā)圖,他把卡的性能發(fā)揮到極致,燒了一下午的token,也沒有燒夠100萬(wàn)個(gè),當(dāng)然他用的卡可能是低配版??紤]到服務(wù)全國(guó)用戶,可能全國(guó)有5000萬(wàn)人在用,大多數(shù)人每天可能就用一兩個(gè)小時(shí)。但因?yàn)槲覀儾荒軠?zhǔn)確預(yù)測(cè)哪些用戶要用多少,什么時(shí)候用,同時(shí)為了容納高峰保障MaaS服務(wù)的商業(yè)穩(wěn)定,機(jī)器要能容納最高峰,低谷還是得放著,成本還是高峰那么多。
我的算力不管是租還是自建,算力成本都是隨時(shí)間穩(wěn)定產(chǎn)生的,推理與訓(xùn)練需求的服務(wù)器也不一樣,這得放多少服務(wù)器,可能需要數(shù)萬(wàn)臺(tái)H20等推理服務(wù)器時(shí)刻運(yùn)轉(zhuǎn)。比如大家不能接受微信在高峰時(shí)段不可用和三天兩頭崩掉。類似的,作為MaaS供應(yīng)商,下游商業(yè)應(yīng)用和C端用戶也需要有體驗(yàn)和服務(wù)的可用性保障。
《中國(guó)企業(yè)家》:速度是指token的輸出速度嗎?
尤洋:賺還是虧,核心的指標(biāo)就是一臺(tái)GPU每秒能出多少token,以及對(duì)應(yīng)的成本。比如它究竟是一秒鐘輸出了1000個(gè)token還是10000個(gè)token,因?yàn)樗罱K是按照token的價(jià)格去賣的。
來(lái)源:AI生成
《中國(guó)企業(yè)家》:公司在2月初上線了DeepSeek的API服務(wù),但經(jīng)過(guò)一個(gè)月的嘗試,決定不做這個(gè)業(yè)務(wù),這是為什么?
尤洋:如果不嘗試的話,我感覺沒有發(fā)言權(quán)的。其他初創(chuàng)公司可能會(huì)覺得,前幾個(gè)月我燒一下,然后過(guò)幾個(gè)月再堅(jiān)持一下,跑不通了,我再把它砍掉,但是我們可能就直接過(guò)了不到一個(gè)月的時(shí)間就把它砍掉了。
《中國(guó)企業(yè)家》:為什么決斷這么迅速?
尤洋:有兩個(gè)原因,第一,我們海外的潞晨云業(yè)務(wù)增長(zhǎng)比較快,我們應(yīng)該把資金投入到非常難得的增長(zhǎng)機(jī)會(huì)里;第二,MaaS的商業(yè)模式還不太成熟就已陷入內(nèi)卷,現(xiàn)在中國(guó)至少有50個(gè)云廠商都在提供開源的DeepSeek模型API服務(wù),它已經(jīng)不是一個(gè)稀缺的東西了,現(xiàn)在部署起來(lái)也比較成熟,利潤(rùn)空間非常有限。
根據(jù)IDC數(shù)據(jù),TOP3公有云已占據(jù)MaaS 85%市場(chǎng)份額,截至2024年底,MaaS全國(guó)用量10000億token/天。以較貴的DeepSeek-V3刊例價(jià)計(jì)算,該業(yè)務(wù)全國(guó)全年市場(chǎng)總計(jì)營(yíng)收期望值為:10000億token/天×8元/百萬(wàn)token×365天=29.2億元。但實(shí)際上,為搶占市場(chǎng),有大量免費(fèi)和低價(jià)token,不計(jì)成本惡性競(jìng)爭(zhēng),遠(yuǎn)達(dá)不到上述營(yíng)收期望。
《中國(guó)企業(yè)家》:公司公告里也說(shuō)了“暫?!?,你也說(shuō)MaaS暫時(shí)是中國(guó)最差的商業(yè)模式,什么時(shí)候會(huì)再次嘗試?
尤洋:我們非常靈活,只要它符合市場(chǎng),并且能產(chǎn)生一定的利潤(rùn),不管用何種方式,只要它能產(chǎn)生健康的利潤(rùn),我覺得應(yīng)該去做。
《中國(guó)企業(yè)家》:初創(chuàng)公司很少提利潤(rùn),一般都是先做規(guī)模,擴(kuò)大市場(chǎng)份額。
尤洋:可能不一定公司需要盈利,但是至少這個(gè)生意邏輯應(yīng)該是跑得通的,我的單位經(jīng)濟(jì)模型到底是什么?長(zhǎng)期來(lái)看,它如何產(chǎn)生價(jià)值,我覺得產(chǎn)生利潤(rùn)就是一個(gè)企業(yè)應(yīng)該追求的東西。
《中國(guó)企業(yè)家》:作為一個(gè)創(chuàng)業(yè)者,你怎么看Kimi和DeepSeek這樣的明星公司?
尤洋:我感覺都有點(diǎn)可遇而不可求。根據(jù)楊植麟的自述,在2023年但凡晚個(gè)幾周,他可能就達(dá)不到他今天的壯舉,他的融資窗口只有一個(gè)月,當(dāng)然,他本身也有張予彤(前金沙江創(chuàng)投主管合伙人)的加持,這種機(jī)會(huì)難得,可遇而不可求,DeepSeek背后的幻方量化資金非常雄厚,較早就有萬(wàn)卡集群了。
這兩者的情況其實(shí)不像是創(chuàng)業(yè),他們本身就已經(jīng)家大業(yè)大了,更像在運(yùn)營(yíng)一個(gè)阿里或者谷歌的研發(fā)中心,而不是一般創(chuàng)業(yè)者的模式。
《中國(guó)企業(yè)家》:MaaS模式之下,就沒有獲益的公司?
尤洋:MaaS對(duì)OpenAI來(lái)說(shuō)是一個(gè)很好的商業(yè)模式。我始終覺得AI最終應(yīng)該形成兩三家企業(yè),兩三家有絕對(duì)實(shí)力的企業(yè)進(jìn)行必然(適度)的壟斷,而不是一家。比如中國(guó)有三家,這三家的模型非常好,它可以像OpenAI那樣去閉源,做成MaaS并獲得合理收益。
現(xiàn)在MaaS商業(yè)模式之所以不好,是因?yàn)榇蠖际褂瞄_源模型或者沒有拉開差距的閉源模型,各家沒有本質(zhì)不同,為了搶占市場(chǎng),只能打價(jià)格戰(zhàn)和免費(fèi)惡性競(jìng)爭(zhēng),但成本是根據(jù)GPU固定產(chǎn)生的。
初創(chuàng)公司的商業(yè)模式是什么?
《中國(guó)企業(yè)家》:你在微博上引用紅杉資本合伙人周逵的話,尋找“難而正確的事”并沉下心來(lái)去做,什么是正確的事?
尤洋:但凡是高價(jià)值的東西,肯定會(huì)有很多人想去做。因?yàn)樗懈邇r(jià)值,肯定也不會(huì)那么簡(jiǎn)單,首先每個(gè)人都選一個(gè)自己相信的點(diǎn),比如我相信未來(lái)就是算力平臺(tái),加上視頻大模型,這兩個(gè)生意是有光明前景的。
《中國(guó)企業(yè)家》:潞晨的商業(yè)模式是什么?
尤洋:第一,幫助企業(yè)去做自己的AI大模型,比如企業(yè)自有模型、行業(yè)模型,我們面向一些中小型客戶以及傳統(tǒng)客戶,在海外就是潞晨云,國(guó)內(nèi)就是一體機(jī),這是我們一直在做的事情;第二,我們最近特別關(guān)注視頻大模型,視頻大模型未來(lái)就是AI的相機(jī)。
《中國(guó)企業(yè)家》:視頻大模型為什么是未來(lái)的機(jī)會(huì)?
尤洋:視頻大模型是未來(lái)三年少有的持續(xù)增長(zhǎng)的市場(chǎng),關(guān)鍵是視頻大模型它有兩點(diǎn),第一,它對(duì)算力的需求優(yōu)化極高,一個(gè)很小的視頻可能都有幾百萬(wàn)token,視頻大模型未來(lái)的三五年核心就是算力優(yōu)化,這是最重要的事情。
來(lái)源:AI生成
第二,視頻大模型產(chǎn)品形態(tài)很有可能會(huì)變成一個(gè)算力優(yōu)化的工作,它跟大語(yǔ)言模型的核心區(qū)別是,大語(yǔ)言模型是需要實(shí)時(shí)交互的,比如說(shuō)我用ChatGPT或者DeepSeek,如果我問它一個(gè)問題,它過(guò)兩三分鐘才回復(fù),甚至超過(guò)20秒回復(fù),我就沒有耐心了。
但視頻大模型我提交一個(gè)任務(wù),比如,我讓它生成一個(gè)電影,生成一個(gè)短視頻,我是可以等的。
《中國(guó)企業(yè)家》:視頻模型的生意本質(zhì)還是MaaS模式。
尤洋:對(duì),但它的MaaS商業(yè)上比較友好,即便用戶同時(shí)擠過(guò)來(lái),可以隊(duì)列式處理請(qǐng)求。
《中國(guó)企業(yè)家》:在云上,訓(xùn)練一個(gè)中小企業(yè)自己專屬的模型的話,大概成本是多少錢?
尤洋:大概是3萬(wàn)元/月,當(dāng)然有的可能需求高一點(diǎn)也可以,也有些企業(yè)花了幾百萬(wàn)。在海外,我們大概每月有100萬(wàn)美元的收入。
《中國(guó)企業(yè)家》:有廠商已經(jīng)把一體機(jī)的價(jià)格賣到了14萬(wàn)元左右,你們的一體機(jī)價(jià)格在數(shù)百萬(wàn)元,差別是什么?
尤洋:如果只是買10萬(wàn)元的一體機(jī)的話,它跑DeepSeek-R1-671B參數(shù)效率不是最高的,也不會(huì)有太好的實(shí)際意義。其實(shí)他們很多是套殼KTransformers這個(gè)開源項(xiàng)目。簡(jiǎn)單做個(gè)性價(jià)比核算:硬件10萬(wàn)元,Q4量化(一種壓縮模型的技術(shù))的殘血DeepSeek-R1/V3模型輸出能力10token/s,只能供1個(gè)用戶使用,每月滿載理論輸出能力26M token;而從云廠買等量未閹割滿血模型的API token價(jià)值一兩百塊,還有免費(fèi)額度和按量折扣。100多萬(wàn)元的一體機(jī)可以服務(wù)高精度高并發(fā)的商業(yè)需求和簡(jiǎn)單私有模型微調(diào)開發(fā),顯然實(shí)用很多。
我們還做了Colossal-AI開源,這是全亞洲最大的大模型訓(xùn)練推理的平臺(tái)系統(tǒng),僅就開發(fā)工具而言,我們?cè)趦?yōu)化方面積累還是非常深的,收獲了5個(gè)世界500強(qiáng)客戶。
華為是個(gè)大機(jī)會(huì)
《中國(guó)企業(yè)家》:現(xiàn)在你們焦慮嗎?畢竟H20受限了。
尤洋:還好,國(guó)內(nèi)沒有H20的話,我們就做國(guó)產(chǎn)芯片,華為昇騰等國(guó)產(chǎn)算力發(fā)展得很快。
《中國(guó)企業(yè)家》:我看到國(guó)外媒體說(shuō)華為要發(fā)新的芯片910C,你們會(huì)覺得有差別嗎?會(huì)對(duì)你們的成本結(jié)構(gòu)有什么影響?
尤洋:差別不大,我們就是想選一個(gè)市場(chǎng)上能買到的最好和最受歡迎的機(jī)器,基于它去做優(yōu)化。其實(shí)我覺得對(duì)我們是更有利的。因?yàn)榧俣▏?guó)產(chǎn)芯片可能暫時(shí)落后英偉達(dá)芯片的話,我們其實(shí)有更多優(yōu)化空間可以做。
《中國(guó)企業(yè)家》:你在微博上也說(shuō),華為的芯片優(yōu)化不可能靠1~2家小公司搞定。
尤洋:華為有幾千人的團(tuán)隊(duì)與芯片業(yè)務(wù)相關(guān),華為的芯片肯定是有中流砥柱的作用。我覺得再配合幾十家、上百家公司去協(xié)同華為生態(tài),這樣比較靠譜,肯定不能靠一兩家小公司去把這個(gè)事情做好。
《中國(guó)企業(yè)家》:目前,國(guó)產(chǎn)芯片相較于英偉達(dá)芯片,主要差距在哪里?
尤洋:一張英偉達(dá)芯片賣多少錢,一張國(guó)產(chǎn)芯片賣多少錢,受限于生產(chǎn)芯片的成本和暫時(shí)的技術(shù)限制,所以(國(guó)內(nèi))生產(chǎn)同樣性能的芯片成本就高很多,導(dǎo)致必須得這樣定價(jià),定價(jià)又導(dǎo)致研發(fā)速度跟不上英偉達(dá)。
來(lái)源:AI生成
比如說(shuō)同樣花了1萬(wàn)塊錢,英偉達(dá)能每分鐘出10萬(wàn)個(gè)token,國(guó)產(chǎn)芯片只能出3萬(wàn)或者2萬(wàn)個(gè)token。我覺得華為等已經(jīng)做得很好了,只不過(guò)英偉達(dá)積累的時(shí)間更長(zhǎng),做了20多年了,飯得一口一口吃。
《中國(guó)企業(yè)家》:在國(guó)產(chǎn)芯片上做優(yōu)化和加速的難點(diǎn)是什么?
尤洋:大模型層,首先DeepSeek的難點(diǎn)是,國(guó)產(chǎn)芯片沒那么穩(wěn)定,它的周邊配套也不是特別好,國(guó)產(chǎn)芯片很多算子缺失,精度、編譯器、集群等又經(jīng)常出bug,導(dǎo)致使用它開發(fā)比較困難,總體上,肯定不是一個(gè)芯片本身跑分高低的問題。
這相當(dāng)于我有一個(gè)賽車,它的設(shè)計(jì)理論速度,比如說(shuō)250公里每小時(shí),但是我可能要精心嘗試跑100次才能跑出一個(gè)這樣的速度,它還沒那么穩(wěn)定。
《中國(guó)企業(yè)家》:對(duì)于AI Infra企業(yè)來(lái)說(shuō),是模型進(jìn)化更重要還是加速更重要?
尤洋:其實(shí)兩者并不矛盾,模型的進(jìn)化能帶動(dòng)需求的旺盛,進(jìn)一步帶動(dòng)對(duì)開發(fā)、應(yīng)用模型的信心和投入,提升對(duì)訓(xùn)推加速、算力的需求,進(jìn)而加速模型進(jìn)化。
《中國(guó)企業(yè)家》:如果你有機(jī)會(huì)去見到DeepSeek的梁文鋒,你會(huì)和他討論什么問題?
尤洋:其實(shí)我最關(guān)心的是,他到底是想做一個(gè)成功的商業(yè)化公司,還是想通過(guò)一些其他手段做一些非盈利的事情?想知道一下,他的目標(biāo)到底是什么,因?yàn)閮烧呖隙ú罹嗍欠浅4蟮?。比如說(shuō)OpenAI可能還是想做一個(gè)Google那樣非常高價(jià)值的商業(yè)化公司,我不知道梁文鋒是不是想做中國(guó)AI版的谷歌。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.