大模型扎堆更新,AI大戰風暴將至
最近這段時間,大模型領域又出現了爆發式更新。
各大科技巨頭紛紛亮出自己的王牌,大模型的更新如同雨后春筍般涌現,一場關于智能、效率和成本的較量即將拉開帷幕。
百度在上周的Create 2025大會上可謂是動作頻頻,風頭無兩。
百度創始人李彥宏高調宣布開源文心4.5系列,并毫不避諱地直指DeepSeek“慢又貴”。在他的介紹下,百度的新模型在性能和成本上才是真正實現了質的飛躍。
圖源:微博
事實上,在過去的一個月中,百度已經連續發布了多款大模型,例如文心大模型4.5 Turbo、深度思考模型X1 Turbo……
其中,文心4.5 Turbo模型在多模態基準測試成績上已經追平了DeepSeek,并且還在API調用價格方面做到了DeepSeek的40%,詳細的介紹可以去看上一篇《李彥宏炮轟DeepSeek,百度AI才是未來》。
圖源:小紅書
而就在今天凌晨,阿里巴巴緊隨其后,發布了新一代通義千問模型Qwen3
阿里云方面宣稱,Qwen3是國內首個“混合推理模型”,將“快思考”與“慢思考”集成進同一個模型,參數量僅為DeepSeek-R1的三分之一,但性能卻全面超越了R1以及OpenAI的o1等全球頂尖模型。這一消息無疑再次讓科技圈為之震動。
據官方介紹,Qwen3采用了混合專家(MoE)架構,總參數量達到235B,但激活僅需22B,預訓練數據量高達36T。
通過多輪強化學習,Qwen3將非思考模式無縫整合到思考模型中,實現了簡單需求的低算力“秒回”和復雜問題的多步驟“深度思考”。
這種“推理/非推理”二合一的設計,不僅提升了模型的智能水平,還大幅降低了算力資源消耗。
圖源:觀察者網
并且在性能方面,Qwen3在推理指令遵循工具調用多語言能力等多個維度都創下了新的紀錄。
例如,在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新了開源紀錄;在代碼能力測試中,Qwen3也表現不俗,突破了70分大關……
此外,如前文所說,Qwen3的部署成本極低,僅需4張H20顯卡即可部署滿血版,顯存占用僅為性能相近模型的三分之一。
阿里云還提供了豐富的模型版本,從30B到235B的MoE模型,再到0.6B到32B的密集模型,每款模型都實現了同尺寸開源模型的最佳性能。
圖源:觀察者網
與此同時,OpenAI也在悄然發力。
近日,OpenAI又一次更新了GPT-4o模型,其CEO奧特曼親自介紹,更新后的GPT-4o在智力和個性方面有了顯著提升。
更新后的模型不僅優化了記憶保存時間,還增強了在STEM領域的問題解決能力。新GPT-4o還在響應方式上進行了改進,能夠更主動地引導對話,輸出更有效的結果。
圖源:X平臺
另一方面,根據數據顯示,目前GPT-4o在LMArena排行榜上已經上升至第二名,而DeepSeek上一次更新的V3新模型,已經下滑至第7名。
圖源:X平臺
種種背景的加持下,許多從業者的目光已經不自覺地聚焦在了一個人身上——梁文鋒
作為DeepSeek的創始人,梁文鋒在過去的一年中憑借多款模型在全球AI市場中一鳴驚人。然而,隨著國內外科技巨頭的相繼發力,圈內外都在期待梁文鋒的下一次出手,期待DeepSeek又將會帶來一個怎樣“驚天動地”的更新。
從目前的消息來看,梁文鋒應該不會讓大家失望。
“舊世界分崩離析,新時代正在光速到來”
在AI領域,梁文鋒的名字已經成為了一個傳奇。
2025年開年,DeepSeek“燃爆”了整個AI圈,其發布的R1模型憑借超低的訓練成本和卓越的性能,迅速在全球范圍內引起了轟動。
而迄今為止,距離R1模型正式發布已經過去了整整99天,馬上就要超百日。這99天,對于DeepSeek來說,是輝煌的起點,也是新的挑戰的預熱。
圖源:中國企業家雜志
2025年1月20日,DeepSeek R1大模型正式發布。而在R1發布之前,DeepSeek團隊已經經歷了無數次的實驗和優化。梁文鋒和他的團隊深知,要在這個競爭激烈的AI市場中脫穎而出,必須要有獨特的優勢和創新的技術。
在招人過程中,梁文鋒的團隊展現了極高的標準和獨特的理念。梁文鋒對人才沒有標簽,不論學歷背景,不論過往業績,他只看這個人的個人能力和個人素質。
這種人才觀,讓DeepSeek的團隊成員不僅具備強大的技術能力,更有著對AI的熱情和創新精神。
梁文鋒曾經說過:“我們招人的原則是看能力,而不是看經驗。如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性與熱愛等更重要。”
此外,梁文鋒對AI和公司的思考,也貫穿了整個R1模型的研發過程。
他認為,語言大模型是通往通用人工智能(AGI)的關鍵路徑。因此,DeepSeek專注于基礎研究,而不是急于開展應用開發。
梁文鋒堅信,通過不斷優化和創新,語言大模型可以逐步實現類人的人工智能。這或許也是DeepSeek如今仍在語言類大模型這條路上走到黑的原因。
但無論怎樣,隨著時間的推移,距離DeepSeek上一次推理模型的更新時間越來越長,外界對R2模型的期待也越來越高。
圖源:微信
此前,DeepSeek曾表示R2模型會在今年年內推出,但否認了前段時間宣稱5月甚至4月底會上線的傳言。盡管如此,外界對R2的期待并未減少。
許多業內人士認為,R2模型將是DeepSeek的又一力作,有望在性能和功能上實現更大的突破。
據了解,DeepSeek公司目前對外界的各種傳言采取不予理睬的態度,更多的是專注于自己的研究當中。梁文鋒和他的團隊深知,只有通過不斷的技術創新和優化,才能在激烈的市場競爭中保持領先地位。
在DeepSeek的崛起過程中,OpenAI一直是其主要競爭對手之一。
然而,國外多家媒體近期卻紛紛表示,OpenAI給梁文鋒的壓力還不夠,所以梁文鋒才能一直高枕無憂地做自己的事,而不用考慮過多的去對外宣傳自己的新模型。
他們認為,OpenAI在面對DeepSeek的快速崛起時,似乎顯得有些力不從心,這種感覺美國的AI公司此前幾乎從未有過。
不過,OpenAI并未如他們口中所說的那么不堪,可能正應了那句話“瞧不起的往往是自家人”。
實際上,OpenAI近期只是換了打法,更專注于DeepSeek從未涉及的文生圖領域。
目前,OpenAI的GPT-4模型在文生圖領域可謂是一馬當先,其能力也得到了國外眾多用戶的驗證,并且還能駕馭格式各樣的風格。
圖源:ChatGPT生成圖片
隨著ChatGPT帶來更多的震撼,美國硅谷已經出現一些“文生圖和文生視頻領域將是未來AI發展的新方向”類似的聲音。
因此,外界同樣在期望DeepSeek文生圖、文生視頻大模型的出現。但這個愿望可能不太容易被實現。
梁文鋒曾經表示:“我們不會過早設計基于模型的一些應用,會專注在大模型上。從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。”
如今,擺在梁文鋒面前的現實是,美國政府正在限制英偉達H20芯片等高端芯片向中國出口,而這正是絕大部分AI公司發展的“地基”。
此外,伴隨著關稅政策不斷變化,貿易全球化的大勢正在遭受美國單方面的削弱,這也很可能增加DeepSeek團隊的研發成本。
因此,在重重壓力的考驗下,聚光燈下的梁文鋒能否帶領團隊沖破枷鎖,讓中國AI再次對世界發出震耳欲聾的咆哮,成為了國內外不少人心中的掛念。
作者 | 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.