網易首頁 > 網易號 > 正文申請入駐

該輪到梁文鋒出手了

2025-04-30 14:42:07　來源: 科技頭版Pro

廣東舉報

分享至

大模型扎堆更新，AI大戰風暴將至

最近這段時間，大模型領域又出現了爆發式更新。

各大科技巨頭紛紛亮出自己的王牌，大模型的更新如同雨后春筍般涌現，一場關于智能、效率和成本的較量即將拉開帷幕。

百度在上周的Create 2025大會上可謂是動作頻頻，風頭無兩。

百度創始人李彥宏高調宣布開源文心4.5系列，并毫不避諱地直指DeepSeek“慢又貴”。在他的介紹下，百度的新模型在性能和成本上才是真正實現了質的飛躍。

圖源：微博

事實上，在過去的一個月中，百度已經連續發布了多款大模型，例如文心大模型4.5 Turbo、深度思考模型X1 Turbo……

其中，文心4.5 Turbo模型在多模態基準測試成績上已經追平了DeepSeek，并且還在API調用價格方面做到了DeepSeek的40%，詳細的介紹可以去看上一篇《李彥宏炮轟DeepSeek，百度AI才是未來》。

圖源：小紅書

而就在今天凌晨，阿里巴巴緊隨其后，發布了新一代通義千問模型Qwen3

阿里云方面宣稱，Qwen3是國內首個“混合推理模型”，將“快思考”與“慢思考”集成進同一個模型，參數量僅為DeepSeek-R1的三分之一，但性能卻全面超越了R1以及OpenAI的o1等全球頂尖模型。這一消息無疑再次讓科技圈為之震動。

據官方介紹，Qwen3采用了混合專家（MoE）架構，總參數量達到235B，但激活僅需22B，預訓練數據量高達36T。

通過多輪強化學習，Qwen3將非思考模式無縫整合到思考模型中，實現了簡單需求的低算力“秒回”和復雜問題的多步驟“深度思考”。

這種“推理/非推理”二合一的設計，不僅提升了模型的智能水平，還大幅降低了算力資源消耗。

圖源：觀察者網

并且在性能方面，Qwen3在推理指令遵循工具調用多語言能力等多個維度都創下了新的紀錄。

例如，在奧數水平的AIME25測評中，Qwen3斬獲81.5分，刷新了開源紀錄；在代碼能力測試中，Qwen3也表現不俗，突破了70分大關……

此外，如前文所說，Qwen3的部署成本極低，僅需4張H20顯卡即可部署滿血版，顯存占用僅為性能相近模型的三分之一。

阿里云還提供了豐富的模型版本，從30B到235B的MoE模型，再到0.6B到32B的密集模型，每款模型都實現了同尺寸開源模型的最佳性能。

圖源：觀察者網

與此同時，OpenAI也在悄然發力。

近日，OpenAI又一次更新了GPT-4o模型，其CEO奧特曼親自介紹，更新后的GPT-4o在智力和個性方面有了顯著提升。

更新后的模型不僅優化了記憶保存時間，還增強了在STEM領域的問題解決能力。新GPT-4o還在響應方式上進行了改進，能夠更主動地引導對話，輸出更有效的結果。

圖源：X平臺

另一方面，根據數據顯示，目前GPT-4o在LMArena排行榜上已經上升至第二名，而DeepSeek上一次更新的V3新模型，已經下滑至第7名。

圖源：X平臺

種種背景的加持下，許多從業者的目光已經不自覺地聚焦在了一個人身上——梁文鋒

作為DeepSeek的創始人，梁文鋒在過去的一年中憑借多款模型在全球AI市場中一鳴驚人。然而，隨著國內外科技巨頭的相繼發力，圈內外都在期待梁文鋒的下一次出手，期待DeepSeek又將會帶來一個怎樣“驚天動地”的更新。

從目前的消息來看，梁文鋒應該不會讓大家失望。

“舊世界分崩離析，新時代正在光速到來”

在AI領域，梁文鋒的名字已經成為了一個傳奇。

2025年開年，DeepSeek“燃爆”了整個AI圈，其發布的R1模型憑借超低的訓練成本和卓越的性能，迅速在全球范圍內引起了轟動。

而迄今為止，距離R1模型正式發布已經過去了整整99天，馬上就要超百日。這99天，對于DeepSeek來說，是輝煌的起點，也是新的挑戰的預熱。

圖源：中國企業家雜志

2025年1月20日，DeepSeek R1大模型正式發布。而在R1發布之前，DeepSeek團隊已經經歷了無數次的實驗和優化。梁文鋒和他的團隊深知，要在這個競爭激烈的AI市場中脫穎而出，必須要有獨特的優勢和創新的技術。

在招人過程中，梁文鋒的團隊展現了極高的標準和獨特的理念。梁文鋒對人才沒有標簽，不論學歷背景，不論過往業績，他只看這個人的個人能力和個人素質。

這種人才觀，讓DeepSeek的團隊成員不僅具備強大的技術能力，更有著對AI的熱情和創新精神。

梁文鋒曾經說過：“我們招人的原則是看能力，而不是看經驗。如果追求短期目標，找現成有經驗的人是對的。但如果看長遠，經驗就沒那么重要，基礎能力、創造性與熱愛等更重要。”

此外，梁文鋒對AI和公司的思考，也貫穿了整個R1模型的研發過程。

他認為，語言大模型是通往通用人工智能（AGI）的關鍵路徑。因此，DeepSeek專注于基礎研究，而不是急于開展應用開發。

梁文鋒堅信，通過不斷優化和創新，語言大模型可以逐步實現類人的人工智能。這或許也是DeepSeek如今仍在語言類大模型這條路上走到黑的原因。

但無論怎樣，隨著時間的推移，距離DeepSeek上一次推理模型的更新時間越來越長，外界對R2模型的期待也越來越高。

圖源：微信

此前，DeepSeek曾表示R2模型會在今年年內推出，但否認了前段時間宣稱5月甚至4月底會上線的傳言。盡管如此，外界對R2的期待并未減少。

許多業內人士認為，R2模型將是DeepSeek的又一力作，有望在性能和功能上實現更大的突破。

據了解，DeepSeek公司目前對外界的各種傳言采取不予理睬的態度，更多的是專注于自己的研究當中。梁文鋒和他的團隊深知，只有通過不斷的技術創新和優化，才能在激烈的市場競爭中保持領先地位。

在DeepSeek的崛起過程中，OpenAI一直是其主要競爭對手之一。

然而，國外多家媒體近期卻紛紛表示，OpenAI給梁文鋒的壓力還不夠，所以梁文鋒才能一直高枕無憂地做自己的事，而不用考慮過多的去對外宣傳自己的新模型。

他們認為，OpenAI在面對DeepSeek的快速崛起時，似乎顯得有些力不從心，這種感覺美國的AI公司此前幾乎從未有過。

不過，OpenAI并未如他們口中所說的那么不堪，可能正應了那句話“瞧不起的往往是自家人”。

實際上，OpenAI近期只是換了打法，更專注于DeepSeek從未涉及的文生圖領域。

目前，OpenAI的GPT-4模型在文生圖領域可謂是一馬當先，其能力也得到了國外眾多用戶的驗證，并且還能駕馭格式各樣的風格。

圖源：ChatGPT生成圖片

隨著ChatGPT帶來更多的震撼，美國硅谷已經出現一些“文生圖和文生視頻領域將是未來AI發展的新方向”類似的聲音。

因此，外界同樣在期望DeepSeek文生圖、文生視頻大模型的出現。但這個愿望可能不太容易被實現。

梁文鋒曾經表示：“我們不會過早設計基于模型的一些應用，會專注在大模型上。從長期看，大模型應用門檻會越來越低，初創公司在未來20年任何時候下場，也都有機會。”

如今，擺在梁文鋒面前的現實是，美國政府正在限制英偉達H20芯片等高端芯片向中國出口，而這正是絕大部分AI公司發展的“地基”。

此外，伴隨著關稅政策不斷變化，貿易全球化的大勢正在遭受美國單方面的削弱，這也很可能增加DeepSeek團隊的研發成本。

因此，在重重壓力的考驗下，聚光燈下的梁文鋒能否帶領團隊沖破枷鎖，讓中國AI再次對世界發出震耳欲聾的咆哮，成為了國內外不少人心中的掛念。

作者 | 劉峰

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

幫你識別一下關于AI的那些“裝腔作勢”

秦朔朋友圈 2025-07-24 00:15:09
1 跟貼 1
宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
199 跟貼 199

ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0

一場對抗OpenAI們的“危險游戲”

虎嗅APP 2025-07-23 18:10:49
0 跟貼 0
國內120+AI Agent開發/構建平臺大盤點（上）：互聯網、云計算、AI、傳統軟件廠商推出的智能體平臺

鈦媒體APP 2025-07-22 19:40:28
11 跟貼 11

創智「小紅書」震撼上線

機器之心Pro 2025-07-22 17:16:14
0 跟貼 0

一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0

網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
大模型如何落地醫療行業，解放醫生？

量子位 2025-07-21 15:11:21
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
用AI找回面子，成功把大侄子看得目瞪口呆

量子位 2025-07-01 14:31:29
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
DeepMind剛拿完IMO金牌，科學家就被Meta挖走了，都是華人大牛

機器之心Pro 2025-07-23 10:21:08
6 跟貼 6
物流業deepseek時刻，中國無人車火爆全球

華商韜略 2025-06-17 10:58:23
0 跟貼 0
AI音頻生成重要突破！清華×生數科技最新研究被ACM頂會收錄

智東西 2025-07-23 20:13:42
1 跟貼 1
OpenAI反挖四位特斯拉、xAI、Meta高級工程師

機器之心Pro 2025-07-09 17:14:35
0 跟貼 0
失敗147次后，他三天寫出萬能提示詞模板，600萬網友吵翻了

量子位 2025-07-13 17:09:11
0 跟貼 0
半年不到，DeepSeek已跌落神壇！用戶都去哪了？

雷科技 2025-07-23 16:30:03
58 跟貼 58
這種地基的房子，如果水泥達標，會比有鋼筋打的地基更牢固

捷克語生活 2025-07-21 08:45:49
27 跟貼 27
有高人預測，不出意外的話，10年后的中國可能是這樣！

皮皮怪搞笑 2025-07-22 08:58:40
1 跟貼 1
真正的智能體軟件工程師：OpenAI研發A-SWE能寫代碼、測試質量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0
造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
3 跟貼 3
國內首個通過主任醫師評測的大模型來了！免費用，技術秘籍公開

智東西 2025-07-23 20:02:06
2 跟貼 2
AI刪庫跑路！硅谷CEO控訴Replit引熱議

量子位 2025-07-22 18:54:56
0 跟貼 0
夸克發布健康大模型，主治醫師難題領先通用模型 30%

歸藏的AI工具箱 2025-07-23 14:55:37
0 跟貼 0
搭載本地大模型科大訊飛X5辦公本可離線AI辦公

經濟觀察報 2025-07-23 20:29:03
0 跟貼 0
用物理學改進深度學習，AI大模型的新突破

量子位 2025-05-05 13:12:31
0 跟貼 0
在物理世界中實現AGI必須要靠端側智能

量子位 2025-04-25 16:21:44
0 跟貼 0
零訓練實現3D場景生成SOTA：英偉達&康奈爾提出文本驅動新流程

機器之心Pro 2025-06-12 12:04:41
0 跟貼 0
杭州市余杭區部分小區供水異常調查情況通報

界面新聞 2025-07-23 17:44:30
25309 跟貼 25309
專業群介紹|青島港灣職業技術學院人工智能專業群

齊魯壹點 2025-07-22 12:03:26
0 跟貼 0
錄取真相：deepseek大模型火了，2025人工智能專業錄取分爆了？

勛哥教你填志愿 2025-07-22 18:29:30
1 跟貼 1
“奧巴馬被逮捕”AI視頻傳遍！一切都在他的掌握之中

關山快訊 2025-07-23 17:09:56
2 跟貼 2
國內首個！夸克健康大模型通過主任醫師考試，斷層領先，超半數醫學生信賴！

智藥局 2025-07-23 20:40:36
4 跟貼 4
中國最早的人工智能

炙青剪輯 2025-07-23 17:57:37
1 跟貼 1

科技頭版Pro

一起見證改變世界的力量

411文章數 146關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

房產

健康

教育

時尚

手機 / 數碼

房產 / 家居

該輪到梁文鋒出手了

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

宗馥莉被質疑讀的是“野雞大學” 校方回應

宗馥莉被質疑讀的是“野雞大學” 校方回應

英格蘭最紅球星 也是加勒比島國驕傲

汪峰森林北同游日本 各帶各娃互不耽誤

律師解析娃哈哈遺產案:遺囑是最大變數

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

《光環無限》美術組曾用辭職"逼宮"：要求用虛幻引擎

海南自由貿易港全島封關，2025年12月18日正式啟動！

呼吸科專家破解呼吸道九大謠言！

撿漏王誕生！黑龍江一考生389分上211鄭州大學，讓人羨慕

搶戲《醬園弄》、尬演《長安荔枝》，雷佳音的舒適圈正在反噬

英格蘭最紅球星也是加勒比島國驕傲

汪峰森林北同游日本各帶各娃互不耽誤

德系大招放盡場地極限測試全新奧迪A5L