奧特曼“AI圈營銷大師”的名頭,正越坐越實。
在被梁文鋒短暫搶走一段時間風頭后,奧特曼正以幾乎每周都上新產品的強度,強勢霸榜AI熱搜。僅在過去一周內,OpenAI就接連推出了新產品Codex——一款代碼AI Agent,和新模型GPT-4.1。
新模型的上線,更是將奧特曼對AI熱度的追逐,展現(xiàn)得淋漓盡致。原本可以一次上線的內容,硬是被奧特曼拆解成了對AI圈的兩次“震撼發(fā)布”:一次是4月15日,GPT-4.1系列模型首次推出,當時只能通過API調用,無法供ChatGPT使用;另一次便是近期終于宣布GPT-4.1模型已正式登陸ChatGPT。
看似多此一舉的背后,實則藏著奧特曼對OpenAI模型調用度規(guī)模的追求。全球最大的大模型整合應用平臺Poe,在近期發(fā)布的《2025年春季人工智能模型使用趨勢》報告中指出,OpenAI的GPT-4.1系列發(fā)布后幾周內,份額迅速增加到了約10%,位列第一。對比DeepSeek,其R1模型使用率,已從2月中旬的峰值7%下降到了4月底的3%,整體使用率下降超過50%。
不過,被奧特曼步步緊逼、搶奪份額的梁文鋒,趕在OpenAI上新模型GPT4.1的同一天,也選擇了出招。
每天“看論文,寫代碼,參與小組討論”的梁文鋒,又發(fā)了篇共同署名論文,但不是外界期待的新一代旗艦模型R2或V4的技術報告,而是一篇圍繞V3 的新論文。
不同于去年12月V3亮相時發(fā)布的技術報告,梁文鋒署名的新論文從硬件架構和模型設計的全新視角,探討了V3模型在擴展過程中面臨的硬件挑戰(zhàn),并展示了一系列硬件與模型協(xié)同設計帶來的降本效果等。
但外界還在等待梁文鋒的大招。早在2月份,路透社就曾爆料,DeepSeek內部正在加速推出R2模型,該模型原計劃在5月初發(fā)布,但現(xiàn)在官方希望能盡早發(fā)布。
如今,距離5月結束不到半個月時間,梁文鋒只是帶領團隊出著一些小招式,如DeepSeek V3模型完成小版本升級,上線新版本DeepSeek-V3-0324,隨后又更新了以DeepSeek-V3為基礎模型微調而來的DeepSeek-Prover-V2——一款數(shù)學定理證明模型。
根據(jù)字母榜(ID:wujicaijing)了解,自2023年5月DeepSeek成立以來,梁文鋒帶領團隊先后推出了10余款模型,類型涵蓋語言、代碼、數(shù)學、視覺多模態(tài)等多個領域。
過去兩年間,DeepSeek一般遵循先出語言基礎模型,再基于語言基礎模型微調其他垂類模型的節(jié)奏。
去年9月,在V2.5新版本中,DeepSeek完成了語言模型V2和代碼模型Coder V2兩個模型的合并,此后Coder模型便開始作為語言模型的一部分,不再單獨更新。
值得注意的是,目前視覺多模態(tài)模型暫未與語言模型合并。這也意味著在外界期待的R2/V4等大招之外,梁文鋒或許還在籌備一些小招式,如去年12月推出的DeepSeek-VL2視覺模型,還有望在V3的基礎上,升級到VL3版本。
至于大眾翹首以待的R2何時到來,按照DeepSeek以往的內部模型更新節(jié)奏,如果梁文鋒希望在V4版本上訓練R2,那么其推出時間或許會是今年8月份左右。
2023年10月,DeepSeek上線V1;
2024年5月,DeepSeek上線V2;
2024年12月,DeepSeek上線V3。
梁文鋒帶領下的團隊基本保持著每7個月更新一次旗艦語言模型的頻率。按此推算,新一代V4模型有望在今年7月份亮相。以R1與V3相隔1個月的推出時間差評估,R2最快便有望在8月份上線。
01
梁文鋒激勵奧特曼
梁文鋒激活了大模型行業(yè)的上新速度,DeepSeek則化身為一眾AI助手上新的加速器。
在被R1震撼的第一時間,想要從梁文鋒手中爭搶熱度的奧特曼,就著手發(fā)布了首個智能體Operator,并開始對外劇透即將上線o3-mini的新消息。
自此之后,奧特曼幾乎以每周都有新產品的更新頻率,讓OpenAI牢牢定在了AI熱搜榜上:在模型側推出了GPT 4.5、o3-mini/o4、GPT 4.1;在產品側上線了Operator、Deep Research、Codex;在體驗側,學習DeepSeek開放思維鏈,并主導了吉卜力風格圖片的流行。
這不能不說是梁文鋒的功勞。在此前接受訪談時,奧特曼稱DeepSeek給自己的一大教訓就是,“當我們隱藏一個功能時(我們隱藏了‘思維鏈’),我們有充分的理由這樣做,但這確實意味著,我們給其他人留下了獲得病毒式傳播的機會?!?/p>
如今,通過更加開放的產品體驗更新,奧特曼正幫ChatGPT找回失去的熱度?!?025年春季人工智能模型使用趨勢》報告顯示,OpenAI的GPT-4.1系列份額達到了約10%,位居第一。
相比被梁文鋒倒逼著更加開放的奧特曼,動作寥寥的DeepSeek,正在迎來意料之中的流量和熱度下滑。曾經一度在中美兩地的蘋果App Store 免費應用下載榜上奪冠的DeepSeek,如今已經分別再次被字節(jié)旗下豆包和OpenAI的ChatGPT趕超。
說到底,作為一款應用而言,DeepSeek暫時還難以持續(xù)對ChatGPT形成威脅,“因為前者更像是一個商品化的模型,而ChatGPT則是一個更趨完善的產品,從而具有更持久的競爭力?!眹鴥阮^部大廠產品經理劉凱向字母榜解釋道。
不同于奧特曼在產品應用側的不斷加碼,梁文鋒則將更多精力放在了模型本身。
此前接受采訪中,梁文鋒便曾提到英偉達的領先,不只是一個公司的努力,而是整個西方技術社區(qū)和產業(yè)共同努力的結果……很多國產芯片發(fā)展不起來,也是因為缺乏配套的技術社區(qū),只有第二手消息,所以中國必然需要有人站到技術的前沿。”
如今,在最新發(fā)布的署名論文中,梁文鋒正在實踐著自己的愿景,其結合DeepSeek在AI硬件上遇到的瓶頸,從低精度計算支持、擴展與擴展融合、網絡拓撲優(yōu)化、內存系統(tǒng)優(yōu)化、魯棒性與容錯等多個方面,提出了對下一代AI硬件的設想。
02
奧特曼重應用,梁文鋒重模型
放任DeepSeek流量和熱度白白流失的背后,或許也體現(xiàn)出了奧特曼和梁文鋒兩人在AI商業(yè)化方面的不同策略。
做大應用的用戶規(guī)模,從來都不是梁文鋒的頭等大事。哪怕在去年5月率先挑起大模型行業(yè)價格戰(zhàn),梁文鋒給出的解釋中,也明確說明其主要目的并不是為了爭搶用戶。
因為在梁文鋒看來,當前階段是技術創(chuàng)新的爆發(fā)期,而不是應用的爆發(fā)期。從長遠來看,依托于開源、免費的商業(yè)策略,梁文鋒追求的是打造一個基于DeepSeek模型的開源生態(tài),自己只負責基礎模型和前沿的創(chuàng)新,其他公司負責構建To B、To C應用?!叭绻苄纬赏暾漠a業(yè)上下游,我們就沒必要自己做應用?!?/p>
相比輕應用而重模型的梁文鋒,奧特曼則將應用放在了第一優(yōu)先級。近期被問到五年后,是一個擁有10億日活躍用戶的網站更有價值,還是一個最先進模型更有價值時,奧特曼選擇了前者,并將模型與歷史上的晶體管做類似,“未來會有很多AGI,它會滲透到各個領域,會變得很便宜。它本身并不能成為一個差異化因素?!?/p>
且不同于梁文鋒想要從開源生態(tài)中實現(xiàn)最終的商業(yè)回報,奧特曼更看重打造ChatGPT的訂閱制度,并將其視為公司的主要收入來源。不同的商業(yè)選擇,直接決定了兩人對應用的不同態(tài)度。
這也更容易理解,為什么奧特曼如此熱衷營銷。畢竟,想要將ChatGPT打造成一款新的超級消費級應用,前提是擁有足夠多的用戶,并盡可能激發(fā)用戶的使用熱情。
束縛梁文鋒無法像奧特曼一樣,將產品更新玩出花樣的另一重因素,則來自DeepSeek產品本身。
環(huán)比市面上主流的AI助手類應用,DeepSeek是唯一暫不支持多模態(tài)功能的產品。1月15日應用上線至今,4個月過去,如語音對話、圖片生成、音樂生成、視頻生成等,DeepSeek仍未提供支持服務。
多模態(tài)能力的缺失,直接限制著DeepSeek的產品更新節(jié)奏,更使得用戶在體驗完新鮮感過后,很難在DeepSeek中尋找到持續(xù)停留的樂趣所在。
作為最早接入DeepSeek的大廠C端應用,騰訊元寶便瞄準DeepSeek的產品短板,其功能更新主要體現(xiàn)在多模態(tài)能力的加持上,相繼上新了圖生文、文生圖、語音對話等差異化功能。
03
多模態(tài)和性價比,藏著梁文鋒的新大招?
當下的短板,也為梁文鋒留下了未來儲蓄大招的創(chuàng)新空間。
此前的采訪中,梁文鋒分享了團隊規(guī)劃的追逐AGI的三條路徑:一是數(shù)學和代碼,二是多模態(tài),三是自然語言本身。
截至目前,在R1發(fā)布至今的100多天內,梁文鋒已經帶領團隊在數(shù)學和代碼,自然語言模型上有所動作,如DeepSeek-Prover-V2和DeepSeek-V3-0324的陸續(xù)亮相。
眼下,只剩多模態(tài)方面暫未有新的進展傳出。考慮到上一次推出視覺多模態(tài)大模型DeepSeek-VL2,已經是去年12月的事情,多模態(tài)模型更新,或許會是梁文鋒向外界展示的新大招之一。
在選擇對外展示方式上,梁文鋒面前也可能擺放著兩條路徑:一是遵循慣例,擇機發(fā)布基于V3模型微調而來的DeepSeek-VL3;二是學習Coder,在V3.5模型中完成語言模型V3和視覺多模態(tài)模型VL3兩個模型的合并。此后,VL模型便開始作為語言模型的一部分,不再單獨更新。
作為通向AGI重要途徑的多模態(tài),其重要性正隨著Agent生態(tài)的發(fā)展日益凸顯。如果梁文鋒再不向外界亮大招,其還將迎接更加現(xiàn)實的競爭挑戰(zhàn),即可能會將更多模型調用需求推向對手。
3月份,AI創(chuàng)業(yè)公司蝴蝶效應發(fā)布的應用產品Manus,以世界首款通用AI Agent的名頭,震驚業(yè)內后,字節(jié)、百度等科技大廠,快速跟進推出了自己的產品。
晚點LatePost 爆料稱,字節(jié)扣子團隊開發(fā)扣子空間時,他們曾考慮優(yōu)先使用DeepSeek-R1,但測試后發(fā)現(xiàn)其調用工具的能力不太理想,最終還是用了自家的豆包模型。
而且,多模態(tài)融合,正在成為大模型行業(yè)的一大共識。越來越多大模型廠商開始在“All in One”的理想產品形態(tài)中,邁出自己的探索步伐:Anthropic、阿里千問發(fā)布了各自的混合模型,谷歌內部正在嘗試將視頻生成融入語言模型。
發(fā)布完代碼智能體Codex后,近期OpenAI高管在“有問必答”活動中更是直言,下一代基礎模型GPT-5,計劃將Codex、Operator、Deep Research和Memory等功能全部整合在一起。
多模態(tài)之外,留給梁文鋒施放大招的另一重點,則是模型性價比。
一貫以性價比開道的DeepSeek,在過去一段時間,正在被阿里、字節(jié)、百度等科技大廠奪走自身的性價比標簽,科技大廠紛紛推出了API價格更低的同類模型。
百度創(chuàng)始人李彥宏更是貼臉開大,吐槽DeepSeek除了沒有多模態(tài)之外,使用起來還慢且貴,“中國市場上絕大多數(shù)的大模型API調用價格都比DeepSeek滿血版要低,而且速度也更快?!?/p>
面對李彥宏們的挑釁,外界都在期待著梁文鋒的新反擊。
參考資料:
《OpenAI:GPT-5就是All in One,集成各種產品》量子位
《2025年春季人工智能模型使用趨勢》Poe
《李彥宏開卷:“DeepSeek慢且貴”》直面AI
《復盤字節(jié)扣子空間開發(fā)歷程:瞄準工作場景,做一個 Agent 系統(tǒng)》晚點LatePost
《Sam Altman :GPT-5 將免費開放,DeepSeek 教訓了我們》APPSO
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.