網易首頁 > 網易號 > 正文申請入駐

奧特曼逼梁文鋒出大招

2025-05-19 15:07:50　來源: 字母榜

北京舉報

分享至

奧特曼“AI圈營銷大師”的名頭，正越坐越實。

在被梁文鋒短暫搶走一段時間風頭后，奧特曼正以幾乎每周都上新產品的強度，強勢霸榜AI熱搜。僅在過去一周內，OpenAI就接連推出了新產品Codex——一款代碼AI Agent，和新模型GPT-4.1。

新模型的上線，更是將奧特曼對AI熱度的追逐，展現(xiàn)得淋漓盡致。原本可以一次上線的內容，硬是被奧特曼拆解成了對AI圈的兩次“震撼發(fā)布”：一次是4月15日，GPT-4.1系列模型首次推出，當時只能通過API調用，無法供ChatGPT使用；另一次便是近期終于宣布GPT-4.1模型已正式登陸ChatGPT。

看似多此一舉的背后，實則藏著奧特曼對OpenAI模型調用度規(guī)模的追求。全球最大的大模型整合應用平臺Poe，在近期發(fā)布的《2025年春季人工智能模型使用趨勢》報告中指出，OpenAI的GPT-4.1系列發(fā)布后幾周內，份額迅速增加到了約10%，位列第一。對比DeepSeek，其R1模型使用率，已從2月中旬的峰值7%下降到了4月底的3%，整體使用率下降超過50%。

不過，被奧特曼步步緊逼、搶奪份額的梁文鋒，趕在OpenAI上新模型GPT4.1的同一天，也選擇了出招。

每天“看論文，寫代碼，參與小組討論”的梁文鋒，又發(fā)了篇共同署名論文，但不是外界期待的新一代旗艦模型R2或V4的技術報告，而是一篇圍繞V3 的新論文。

不同于去年12月V3亮相時發(fā)布的技術報告，梁文鋒署名的新論文從硬件架構和模型設計的全新視角，探討了V3模型在擴展過程中面臨的硬件挑戰(zhàn)，并展示了一系列硬件與模型協(xié)同設計帶來的降本效果等。

但外界還在等待梁文鋒的大招。早在2月份，路透社就曾爆料，DeepSeek內部正在加速推出R2模型，該模型原計劃在5月初發(fā)布，但現(xiàn)在官方希望能盡早發(fā)布。

如今，距離5月結束不到半個月時間，梁文鋒只是帶領團隊出著一些小招式，如DeepSeek V3模型完成小版本升級，上線新版本DeepSeek-V3-0324，隨后又更新了以DeepSeek-V3為基礎模型微調而來的DeepSeek-Prover-V2——一款數(shù)學定理證明模型。

根據(jù)字母榜（ID：wujicaijing）了解，自2023年5月DeepSeek成立以來，梁文鋒帶領團隊先后推出了10余款模型，類型涵蓋語言、代碼、數(shù)學、視覺多模態(tài)等多個領域。

過去兩年間，DeepSeek一般遵循先出語言基礎模型，再基于語言基礎模型微調其他垂類模型的節(jié)奏。

去年9月，在V2.5新版本中，DeepSeek完成了語言模型V2和代碼模型Coder V2兩個模型的合并，此后Coder模型便開始作為語言模型的一部分，不再單獨更新。

值得注意的是，目前視覺多模態(tài)模型暫未與語言模型合并。這也意味著在外界期待的R2/V4等大招之外，梁文鋒或許還在籌備一些小招式，如去年12月推出的DeepSeek-VL2視覺模型，還有望在V3的基礎上，升級到VL3版本。

至于大眾翹首以待的R2何時到來，按照DeepSeek以往的內部模型更新節(jié)奏，如果梁文鋒希望在V4版本上訓練R2,那么其推出時間或許會是今年8月份左右。

2023年10月，DeepSeek上線V1；

2024年5月，DeepSeek上線V2；

2024年12月，DeepSeek上線V3。

梁文鋒帶領下的團隊基本保持著每7個月更新一次旗艦語言模型的頻率。按此推算，新一代V4模型有望在今年7月份亮相。以R1與V3相隔1個月的推出時間差評估，R2最快便有望在8月份上線。

梁文鋒激勵奧特曼

梁文鋒激活了大模型行業(yè)的上新速度，DeepSeek則化身為一眾AI助手上新的加速器。

在被R1震撼的第一時間，想要從梁文鋒手中爭搶熱度的奧特曼，就著手發(fā)布了首個智能體Operator，并開始對外劇透即將上線o3-mini的新消息。

自此之后，奧特曼幾乎以每周都有新產品的更新頻率，讓OpenAI牢牢定在了AI熱搜榜上：在模型側推出了GPT 4.5、o3-mini/o4、GPT 4.1；在產品側上線了Operator、Deep Research、Codex；在體驗側，學習DeepSeek開放思維鏈，并主導了吉卜力風格圖片的流行。

這不能不說是梁文鋒的功勞。在此前接受訪談時，奧特曼稱DeepSeek給自己的一大教訓就是，“當我們隱藏一個功能時（我們隱藏了‘思維鏈’），我們有充分的理由這樣做，但這確實意味著，我們給其他人留下了獲得病毒式傳播的機會?！?/p>

如今，通過更加開放的產品體驗更新，奧特曼正幫ChatGPT找回失去的熱度?！?025年春季人工智能模型使用趨勢》報告顯示，OpenAI的GPT-4.1系列份額達到了約10%，位居第一。

相比被梁文鋒倒逼著更加開放的奧特曼，動作寥寥的DeepSeek，正在迎來意料之中的流量和熱度下滑。曾經一度在中美兩地的蘋果App Store 免費應用下載榜上奪冠的DeepSeek，如今已經分別再次被字節(jié)旗下豆包和OpenAI的ChatGPT趕超。

說到底，作為一款應用而言，DeepSeek暫時還難以持續(xù)對ChatGPT形成威脅，“因為前者更像是一個商品化的模型，而ChatGPT則是一個更趨完善的產品，從而具有更持久的競爭力?！眹鴥阮^部大廠產品經理劉凱向字母榜解釋道。

不同于奧特曼在產品應用側的不斷加碼，梁文鋒則將更多精力放在了模型本身。

此前接受采訪中，梁文鋒便曾提到英偉達的領先，不只是一個公司的努力，而是整個西方技術社區(qū)和產業(yè)共同努力的結果……很多國產芯片發(fā)展不起來，也是因為缺乏配套的技術社區(qū)，只有第二手消息，所以中國必然需要有人站到技術的前沿。”

如今，在最新發(fā)布的署名論文中，梁文鋒正在實踐著自己的愿景，其結合DeepSeek在AI硬件上遇到的瓶頸，從低精度計算支持、擴展與擴展融合、網絡拓撲優(yōu)化、內存系統(tǒng)優(yōu)化、魯棒性與容錯等多個方面，提出了對下一代AI硬件的設想。

奧特曼重應用，梁文鋒重模型

放任DeepSeek流量和熱度白白流失的背后，或許也體現(xiàn)出了奧特曼和梁文鋒兩人在AI商業(yè)化方面的不同策略。

做大應用的用戶規(guī)模，從來都不是梁文鋒的頭等大事。哪怕在去年5月率先挑起大模型行業(yè)價格戰(zhàn)，梁文鋒給出的解釋中，也明確說明其主要目的并不是為了爭搶用戶。

因為在梁文鋒看來，當前階段是技術創(chuàng)新的爆發(fā)期，而不是應用的爆發(fā)期。從長遠來看，依托于開源、免費的商業(yè)策略，梁文鋒追求的是打造一個基于DeepSeek模型的開源生態(tài)，自己只負責基礎模型和前沿的創(chuàng)新，其他公司負責構建To B、To C應用?！叭绻苄纬赏暾漠a業(yè)上下游，我們就沒必要自己做應用?！?/p>

相比輕應用而重模型的梁文鋒，奧特曼則將應用放在了第一優(yōu)先級。近期被問到五年后，是一個擁有10億日活躍用戶的網站更有價值，還是一個最先進模型更有價值時，奧特曼選擇了前者，并將模型與歷史上的晶體管做類似，“未來會有很多AGI，它會滲透到各個領域，會變得很便宜。它本身并不能成為一個差異化因素?！?/p>

且不同于梁文鋒想要從開源生態(tài)中實現(xiàn)最終的商業(yè)回報，奧特曼更看重打造ChatGPT的訂閱制度，并將其視為公司的主要收入來源。不同的商業(yè)選擇，直接決定了兩人對應用的不同態(tài)度。

這也更容易理解，為什么奧特曼如此熱衷營銷。畢竟，想要將ChatGPT打造成一款新的超級消費級應用，前提是擁有足夠多的用戶，并盡可能激發(fā)用戶的使用熱情。

束縛梁文鋒無法像奧特曼一樣，將產品更新玩出花樣的另一重因素，則來自DeepSeek產品本身。

環(huán)比市面上主流的AI助手類應用，DeepSeek是唯一暫不支持多模態(tài)功能的產品。1月15日應用上線至今，4個月過去，如語音對話、圖片生成、音樂生成、視頻生成等，DeepSeek仍未提供支持服務。

多模態(tài)能力的缺失，直接限制著DeepSeek的產品更新節(jié)奏，更使得用戶在體驗完新鮮感過后，很難在DeepSeek中尋找到持續(xù)停留的樂趣所在。

作為最早接入DeepSeek的大廠C端應用，騰訊元寶便瞄準DeepSeek的產品短板，其功能更新主要體現(xiàn)在多模態(tài)能力的加持上，相繼上新了圖生文、文生圖、語音對話等差異化功能。

多模態(tài)和性價比，藏著梁文鋒的新大招？

當下的短板，也為梁文鋒留下了未來儲蓄大招的創(chuàng)新空間。

此前的采訪中，梁文鋒分享了團隊規(guī)劃的追逐AGI的三條路徑：一是數(shù)學和代碼，二是多模態(tài)，三是自然語言本身。

截至目前，在R1發(fā)布至今的100多天內，梁文鋒已經帶領團隊在數(shù)學和代碼，自然語言模型上有所動作，如DeepSeek-Prover-V2和DeepSeek-V3-0324的陸續(xù)亮相。

眼下，只剩多模態(tài)方面暫未有新的進展傳出。考慮到上一次推出視覺多模態(tài)大模型DeepSeek-VL2，已經是去年12月的事情，多模態(tài)模型更新，或許會是梁文鋒向外界展示的新大招之一。

在選擇對外展示方式上，梁文鋒面前也可能擺放著兩條路徑：一是遵循慣例，擇機發(fā)布基于V3模型微調而來的DeepSeek-VL3；二是學習Coder，在V3.5模型中完成語言模型V3和視覺多模態(tài)模型VL3兩個模型的合并。此后，VL模型便開始作為語言模型的一部分，不再單獨更新。

作為通向AGI重要途徑的多模態(tài)，其重要性正隨著Agent生態(tài)的發(fā)展日益凸顯。如果梁文鋒再不向外界亮大招，其還將迎接更加現(xiàn)實的競爭挑戰(zhàn)，即可能會將更多模型調用需求推向對手。

3月份，AI創(chuàng)業(yè)公司蝴蝶效應發(fā)布的應用產品Manus，以世界首款通用AI Agent的名頭，震驚業(yè)內后，字節(jié)、百度等科技大廠，快速跟進推出了自己的產品。

晚點LatePost 爆料稱，字節(jié)扣子團隊開發(fā)扣子空間時，他們曾考慮優(yōu)先使用DeepSeek-R1，但測試后發(fā)現(xiàn)其調用工具的能力不太理想，最終還是用了自家的豆包模型。

而且，多模態(tài)融合，正在成為大模型行業(yè)的一大共識。越來越多大模型廠商開始在“All in One”的理想產品形態(tài)中，邁出自己的探索步伐：Anthropic、阿里千問發(fā)布了各自的混合模型，谷歌內部正在嘗試將視頻生成融入語言模型。

發(fā)布完代碼智能體Codex后，近期OpenAI高管在“有問必答”活動中更是直言，下一代基礎模型GPT-5，計劃將Codex、Operator、Deep Research和Memory等功能全部整合在一起。

多模態(tài)之外，留給梁文鋒施放大招的另一重點，則是模型性價比。

一貫以性價比開道的DeepSeek，在過去一段時間，正在被阿里、字節(jié)、百度等科技大廠奪走自身的性價比標簽，科技大廠紛紛推出了API價格更低的同類模型。

百度創(chuàng)始人李彥宏更是貼臉開大，吐槽DeepSeek除了沒有多模態(tài)之外，使用起來還慢且貴，“中國市場上絕大多數(shù)的大模型API調用價格都比DeepSeek滿血版要低，而且速度也更快?！?/p>

面對李彥宏們的挑釁，外界都在期待著梁文鋒的新反擊。

參考資料：

《OpenAI：GPT-5就是All in One，集成各種產品》量子位

《2025年春季人工智能模型使用趨勢》Poe

《李彥宏開卷：“DeepSeek慢且貴”》直面AI

《復盤字節(jié)扣子空間開發(fā)歷程：瞄準工作場景，做一個 Agent 系統(tǒng)》晚點LatePost

《Sam Altman ：GPT-5 將免費開放，DeepSeek 教訓了我們》APPSO

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.