奧特曼“AI圈營(yíng)銷大師”的名頭,正越坐越實(shí)。
在被梁文鋒短暫搶走一段時(shí)間風(fēng)頭后,奧特曼正以幾乎每周都上新產(chǎn)品的強(qiáng)度,強(qiáng)勢(shì)霸榜AI熱搜。僅在過(guò)去一周內(nèi),OpenAI就接連推出了新產(chǎn)品Codex——一款代碼AI Agent,和新模型GPT-4.1。
新模型的上線,更是將奧特曼對(duì)AI熱度的追逐,展現(xiàn)得淋漓盡致。原本可以一次上線的內(nèi)容,硬是被奧特曼拆解成了對(duì)AI圈的兩次“震撼發(fā)布”:一次是4月15日,GPT-4.1系列模型首次推出,當(dāng)時(shí)只能通過(guò)API調(diào)用,無(wú)法供ChatGPT使用;另一次便是近期終于宣布GPT-4.1模型已正式登陸ChatGPT。
看似多此一舉的背后,實(shí)則藏著奧特曼對(duì)OpenAI模型調(diào)用度規(guī)模的追求。全球最大的大模型整合應(yīng)用平臺(tái)Poe,在近期發(fā)布的《2025年春季人工智能模型使用趨勢(shì)》報(bào)告中指出,OpenAI的GPT-4.1系列發(fā)布后幾周內(nèi),份額迅速增加到了約10%,位列第一。對(duì)比DeepSeek,其R1模型使用率,已從2月中旬的峰值7%下降到了4月底的3%,整體使用率下降超過(guò)50%。
不過(guò),被奧特曼步步緊逼、搶奪份額的梁文鋒,趕在OpenAI上新模型GPT4.1的同一天,也選擇了出招。
每天“看論文,寫代碼,參與小組討論”的梁文鋒,又發(fā)了篇共同署名論文,但不是外界期待的新一代旗艦?zāi)P蚏2或V4的技術(shù)報(bào)告,而是一篇圍繞V3 的新論文。
不同于去年12月V3亮相時(shí)發(fā)布的技術(shù)報(bào)告,梁文鋒署名的新論文從硬件架構(gòu)和模型設(shè)計(jì)的全新視角,探討了V3模型在擴(kuò)展過(guò)程中面臨的硬件挑戰(zhàn),并展示了一系列硬件與模型協(xié)同設(shè)計(jì)帶來(lái)的降本效果等。
但外界還在等待梁文鋒的大招。早在2月份,路透社就曾爆料,DeepSeek內(nèi)部正在加速推出R2模型,該模型原計(jì)劃在5月初發(fā)布,但現(xiàn)在官方希望能盡早發(fā)布。
如今,距離5月結(jié)束不到半個(gè)月時(shí)間,梁文鋒只是帶領(lǐng)團(tuán)隊(duì)出著一些小招式,如DeepSeek V3模型完成小版本升級(jí),上線新版本DeepSeek-V3-0324,隨后又更新了以DeepSeek-V3為基礎(chǔ)模型微調(diào)而來(lái)的DeepSeek-Prover-V2——一款數(shù)學(xué)定理證明模型。
根據(jù)字母榜(ID:wujicaijing)了解,自2023年5月DeepSeek成立以來(lái),梁文鋒帶領(lǐng)團(tuán)隊(duì)先后推出了10余款模型,類型涵蓋語(yǔ)言、代碼、數(shù)學(xué)、視覺(jué)多模態(tài)等多個(gè)領(lǐng)域。
過(guò)去兩年間,DeepSeek一般遵循先出語(yǔ)言基礎(chǔ)模型,再基于語(yǔ)言基礎(chǔ)模型微調(diào)其他垂類模型的節(jié)奏。
去年9月,在V2.5新版本中,DeepSeek完成了語(yǔ)言模型V2和代碼模型Coder V2兩個(gè)模型的合并,此后Coder模型便開始作為語(yǔ)言模型的一部分,不再單獨(dú)更新。
值得注意的是,目前視覺(jué)多模態(tài)模型暫未與語(yǔ)言模型合并。這也意味著在外界期待的R2/V4等大招之外,梁文鋒或許還在籌備一些小招式,如去年12月推出的DeepSeek-VL2視覺(jué)模型,還有望在V3的基礎(chǔ)上,升級(jí)到VL3版本。
至于大眾翹首以待的R2何時(shí)到來(lái),按照DeepSeek以往的內(nèi)部模型更新節(jié)奏,如果梁文鋒希望在V4版本上訓(xùn)練R2,那么其推出時(shí)間或許會(huì)是今年8月份左右。
2023年10月,DeepSeek上線V1;
2024年5月,DeepSeek上線V2;
2024年12月,DeepSeek上線V3。
梁文鋒帶領(lǐng)下的團(tuán)隊(duì)基本保持著每7個(gè)月更新一次旗艦語(yǔ)言模型的頻率。按此推算,新一代V4模型有望在今年7月份亮相。以R1與V3相隔1個(gè)月的推出時(shí)間差評(píng)估,R2最快便有望在8月份上線。
01
梁文鋒激勵(lì)奧特曼
梁文鋒激活了大模型行業(yè)的上新速度,DeepSeek則化身為一眾AI助手上新的加速器。
在被R1震撼的第一時(shí)間,想要從梁文鋒手中爭(zhēng)搶熱度的奧特曼,就著手發(fā)布了首個(gè)智能體Operator,并開始對(duì)外劇透即將上線o3-mini的新消息。
自此之后,奧特曼幾乎以每周都有新產(chǎn)品的更新頻率,讓OpenAI牢牢定在了AI熱搜榜上:在模型側(cè)推出了GPT 4.5、o3-mini/o4、GPT 4.1;在產(chǎn)品側(cè)上線了Operator、Deep Research、Codex;在體驗(yàn)側(cè),學(xué)習(xí)DeepSeek開放思維鏈,并主導(dǎo)了吉卜力風(fēng)格圖片的流行。
這不能不說(shuō)是梁文鋒的功勞。在此前接受訪談時(shí),奧特曼稱DeepSeek給自己的一大教訓(xùn)就是,“當(dāng)我們隱藏一個(gè)功能時(shí)(我們隱藏了‘思維鏈’),我們有充分的理由這樣做,但這確實(shí)意味著,我們給其他人留下了獲得病毒式傳播的機(jī)會(huì)。”
如今,通過(guò)更加開放的產(chǎn)品體驗(yàn)更新,奧特曼正幫ChatGPT找回失去的熱度。《2025年春季人工智能模型使用趨勢(shì)》報(bào)告顯示,OpenAI的GPT-4.1系列份額達(dá)到了約10%,位居第一。
相比被梁文鋒倒逼著更加開放的奧特曼,動(dòng)作寥寥的DeepSeek,正在迎來(lái)意料之中的流量和熱度下滑。曾經(jīng)一度在中美兩地的蘋果App Store 免費(fèi)應(yīng)用下載榜上奪冠的DeepSeek,如今已經(jīng)分別再次被字節(jié)旗下豆包和OpenAI的ChatGPT趕超。
說(shuō)到底,作為一款應(yīng)用而言,DeepSeek暫時(shí)還難以持續(xù)對(duì)ChatGPT形成威脅,“因?yàn)榍罢吒袷且粋€(gè)商品化的模型,而ChatGPT則是一個(gè)更趨完善的產(chǎn)品,從而具有更持久的競(jìng)爭(zhēng)力。”國(guó)內(nèi)頭部大廠產(chǎn)品經(jīng)理劉凱向字母榜解釋道。
不同于奧特曼在產(chǎn)品應(yīng)用側(cè)的不斷加碼,梁文鋒則將更多精力放在了模型本身。
此前接受采訪中,梁文鋒便曾提到英偉達(dá)的領(lǐng)先,不只是一個(gè)公司的努力,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果……很多國(guó)產(chǎn)芯片發(fā)展不起來(lái),也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,所以中國(guó)必然需要有人站到技術(shù)的前沿。”
如今,在最新發(fā)布的署名論文中,梁文鋒正在實(shí)踐著自己的愿景,其結(jié)合DeepSeek在AI硬件上遇到的瓶頸,從低精度計(jì)算支持、擴(kuò)展與擴(kuò)展融合、網(wǎng)絡(luò)拓?fù)鋬?yōu)化、內(nèi)存系統(tǒng)優(yōu)化、魯棒性與容錯(cuò)等多個(gè)方面,提出了對(duì)下一代AI硬件的設(shè)想。
02
奧特曼重應(yīng)用,梁文鋒重模型
放任DeepSeek流量和熱度白白流失的背后,或許也體現(xiàn)出了奧特曼和梁文鋒兩人在AI商業(yè)化方面的不同策略。
做大應(yīng)用的用戶規(guī)模,從來(lái)都不是梁文鋒的頭等大事。哪怕在去年5月率先挑起大模型行業(yè)價(jià)格戰(zhàn),梁文鋒給出的解釋中,也明確說(shuō)明其主要目的并不是為了爭(zhēng)搶用戶。
因?yàn)樵诹何匿h看來(lái),當(dāng)前階段是技術(shù)創(chuàng)新的爆發(fā)期,而不是應(yīng)用的爆發(fā)期。從長(zhǎng)遠(yuǎn)來(lái)看,依托于開源、免費(fèi)的商業(yè)策略,梁文鋒追求的是打造一個(gè)基于DeepSeek模型的開源生態(tài),自己只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新,其他公司負(fù)責(zé)構(gòu)建To B、To C應(yīng)用。“如果能形成完整的產(chǎn)業(yè)上下游,我們就沒(méi)必要自己做應(yīng)用。”
相比輕應(yīng)用而重模型的梁文鋒,奧特曼則將應(yīng)用放在了第一優(yōu)先級(jí)。近期被問(wèn)到五年后,是一個(gè)擁有10億日活躍用戶的網(wǎng)站更有價(jià)值,還是一個(gè)最先進(jìn)模型更有價(jià)值時(shí),奧特曼選擇了前者,并將模型與歷史上的晶體管做類似,“未來(lái)會(huì)有很多AGI,它會(huì)滲透到各個(gè)領(lǐng)域,會(huì)變得很便宜。它本身并不能成為一個(gè)差異化因素。”
且不同于梁文鋒想要從開源生態(tài)中實(shí)現(xiàn)最終的商業(yè)回報(bào),奧特曼更看重打造ChatGPT的訂閱制度,并將其視為公司的主要收入來(lái)源。不同的商業(yè)選擇,直接決定了兩人對(duì)應(yīng)用的不同態(tài)度。
這也更容易理解,為什么奧特曼如此熱衷營(yíng)銷。畢竟,想要將ChatGPT打造成一款新的超級(jí)消費(fèi)級(jí)應(yīng)用,前提是擁有足夠多的用戶,并盡可能激發(fā)用戶的使用熱情。
束縛梁文鋒無(wú)法像奧特曼一樣,將產(chǎn)品更新玩出花樣的另一重因素,則來(lái)自DeepSeek產(chǎn)品本身。
環(huán)比市面上主流的AI助手類應(yīng)用,DeepSeek是唯一暫不支持多模態(tài)功能的產(chǎn)品。1月15日應(yīng)用上線至今,4個(gè)月過(guò)去,如語(yǔ)音對(duì)話、圖片生成、音樂(lè)生成、視頻生成等,DeepSeek仍未提供支持服務(wù)。
多模態(tài)能力的缺失,直接限制著DeepSeek的產(chǎn)品更新節(jié)奏,更使得用戶在體驗(yàn)完新鮮感過(guò)后,很難在DeepSeek中尋找到持續(xù)停留的樂(lè)趣所在。
作為最早接入DeepSeek的大廠C端應(yīng)用,騰訊元寶便瞄準(zhǔn)DeepSeek的產(chǎn)品短板,其功能更新主要體現(xiàn)在多模態(tài)能力的加持上,相繼上新了圖生文、文生圖、語(yǔ)音對(duì)話等差異化功能。
03
多模態(tài)和性價(jià)比,藏著梁文鋒的新大招?
當(dāng)下的短板,也為梁文鋒留下了未來(lái)儲(chǔ)蓄大招的創(chuàng)新空間。
此前的采訪中,梁文鋒分享了團(tuán)隊(duì)規(guī)劃的追逐AGI的三條路徑:一是數(shù)學(xué)和代碼,二是多模態(tài),三是自然語(yǔ)言本身。
截至目前,在R1發(fā)布至今的100多天內(nèi),梁文鋒已經(jīng)帶領(lǐng)團(tuán)隊(duì)在數(shù)學(xué)和代碼,自然語(yǔ)言模型上有所動(dòng)作,如DeepSeek-Prover-V2和DeepSeek-V3-0324的陸續(xù)亮相。
眼下,只剩多模態(tài)方面暫未有新的進(jìn)展傳出。考慮到上一次推出視覺(jué)多模態(tài)大模型DeepSeek-VL2,已經(jīng)是去年12月的事情,多模態(tài)模型更新,或許會(huì)是梁文鋒向外界展示的新大招之一。
在選擇對(duì)外展示方式上,梁文鋒面前也可能擺放著兩條路徑:一是遵循慣例,擇機(jī)發(fā)布基于V3模型微調(diào)而來(lái)的DeepSeek-VL3;二是學(xué)習(xí)Coder,在V3.5模型中完成語(yǔ)言模型V3和視覺(jué)多模態(tài)模型VL3兩個(gè)模型的合并。此后,VL模型便開始作為語(yǔ)言模型的一部分,不再單獨(dú)更新。
作為通向AGI重要途徑的多模態(tài),其重要性正隨著Agent生態(tài)的發(fā)展日益凸顯。如果梁文鋒再不向外界亮大招,其還將迎接更加現(xiàn)實(shí)的競(jìng)爭(zhēng)挑戰(zhàn),即可能會(huì)將更多模型調(diào)用需求推向?qū)κ帧?/p>
3月份,AI創(chuàng)業(yè)公司蝴蝶效應(yīng)發(fā)布的應(yīng)用產(chǎn)品Manus,以世界首款通用AI Agent的名頭,震驚業(yè)內(nèi)后,字節(jié)、百度等科技大廠,快速跟進(jìn)推出了自己的產(chǎn)品。
晚點(diǎn)LatePost 爆料稱,字節(jié)扣子團(tuán)隊(duì)開發(fā)扣子空間時(shí),他們?cè)紤]優(yōu)先使用DeepSeek-R1,但測(cè)試后發(fā)現(xiàn)其調(diào)用工具的能力不太理想,最終還是用了自家的豆包模型。
而且,多模態(tài)融合,正在成為大模型行業(yè)的一大共識(shí)。越來(lái)越多大模型廠商開始在“All in One”的理想產(chǎn)品形態(tài)中,邁出自己的探索步伐:Anthropic、阿里千問(wèn)發(fā)布了各自的混合模型,谷歌內(nèi)部正在嘗試將視頻生成融入語(yǔ)言模型。
發(fā)布完代碼智能體Codex后,近期OpenAI高管在“有問(wèn)必答”活動(dòng)中更是直言,下一代基礎(chǔ)模型GPT-5,計(jì)劃將Codex、Operator、Deep Research和Memory等功能全部整合在一起。
多模態(tài)之外,留給梁文鋒施放大招的另一重點(diǎn),則是模型性價(jià)比。
一貫以性價(jià)比開道的DeepSeek,在過(guò)去一段時(shí)間,正在被阿里、字節(jié)、百度等科技大廠奪走自身的性價(jià)比標(biāo)簽,科技大廠紛紛推出了API價(jià)格更低的同類模型。
百度創(chuàng)始人李彥宏更是貼臉開大,吐槽DeepSeek除了沒(méi)有多模態(tài)之外,使用起來(lái)還慢且貴,“中國(guó)市場(chǎng)上絕大多數(shù)的大模型API調(diào)用價(jià)格都比DeepSeek滿血版要低,而且速度也更快。”
面對(duì)李彥宏們的挑釁,外界都在期待著梁文鋒的新反擊。
參考資料:
《OpenAI:GPT-5就是All in One,集成各種產(chǎn)品》量子位
《2025年春季人工智能模型使用趨勢(shì)》Poe
《李彥宏開卷:“DeepSeek慢且貴”》直面AI
《復(fù)盤字節(jié)扣子空間開發(fā)歷程:瞄準(zhǔn)工作場(chǎng)景,做一個(gè) Agent 系統(tǒng)》晚點(diǎn)LatePost
《Sam Altman :GPT-5 將免費(fèi)開放,DeepSeek 教訓(xùn)了我們》APPSO
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.