網易首頁 > 網易號 > 正文申請入駐

改款DeepSeek，亂了華為心態

2025-07-08 15:27:40　來源: 源媒匯

廣東舉報

分享至

文源：源Byte

作者：柯基的柯

當技術參數的相關性飆到0.927，行業直接炸了。

近期，有研究團隊在GitHub上公開比對數據，指出華為盤古ProMoE與阿里Qwen-2.5 14B參數結構高度雷同，居然高達0.927，超過業內正常范圍（通常低于0.7）。華為盤古團隊迅速回應，強調其模型基于昇騰硬件優化，屬于“殊途同歸”，向來在輿論場上不輸陣仗的阿里，卻意外保持沉默。

截圖來源于諾亞方舟實驗室公號

無獨有偶，就在上個月，月之暗面的Kimi-Dev-72B憑借60.4%的測試成績驚艷亮相，因“Basemodel:Qwen2.5-72B”的標注被貼上“套殼”標簽陷入爭議。就在開發者們爭論不休之時，外界發現“受害者”依舊是阿里，不禁發出如此疑問：這是微調技術的勝利，還是原創性匱乏的遮羞布？

而曾被寄予厚望的DeepSeek R2，遲遲未能面世，這款有望繼續對世界頂級大模型持續施壓的模型長期“跳票”，一定程度助推了國產大模型的技術標準“失焦”。

在一片R2“狼來了”的聲音中，市場似乎在等待中逐漸失去耐心，正在讓國產大模型的競爭，從技術比拼滑向資源內耗。

參數之爭背后的技術迷局

華為盤古ProMoE與阿里Qwen-2.5 14B的“0.927相似度”，直接剖開了大模型研發的黑箱。

研究團隊通過比對注意力參數分布，發現兩者結構相似性遠超行業常態。華為堅稱其模型基于昇騰硬件優化，屬于“異構架構的殊途同歸”；阿里則保持沉默，但開源社區已涌現對代碼復用合規性的質疑。

然而，技術細節的爭議很快滑向商業博弈的泥潭。

盤古團隊緊急發布技術白皮書，強調其MoE架構的專利布局；阿里則加速推進Qwen-3.0迭代，似乎在用版本升級對沖輿論風險。一位不愿具名的芯片工程師透露：“參數結構的趨同，本質上是算力軍備競賽下的技術妥協。”

開發者社區并不買賬，用戶 @HonestAGI 通過 “LLM 指紋” 技術反向驗證，結果與原始研究高度吻合。技術趨同是否等同于抄襲？這一問題在開源社區引發激烈辯論。

支持華為的聲音認為，大模型領域的技術重疊難以避免，關鍵在于優化和落地。昇騰生態的擁躉特別指出，盤古的動態專家網絡設計解決了分布式訓練負載均衡的難題，是實打實的創新。

但反對者，反對者翻出匿名爆料，稱部分盤古模型存在“洗水印”嫌棄——即對開源模型進行微調后重新包裝。盡管爆料未提供具體證據，但阿里通義千問的開源協議中明確要求衍生模型需標注來源，這一細節讓爭議更加撲朔迷離。

從技術角度看，參數結構的相似性可能源于訓練數據的重疊或優化目標的趨同。但問題的核心在于，當兩家巨頭在公開場合強調“自主創新”時，這種高度一致性是否違背了開源協議的精神？

華為盤古團隊的回應中，一個細節值得玩味：他們提到“參考了業界開源實踐”，但未具體說明哪些實踐。這種模糊表述讓外界難以判斷其行為的邊界。而阿里的沉默，則被解讀為一種戰術性回避，避免卷入公開論戰。

一位長期觀察AI行業的分析師表示：“參數之爭的背后，是國產大模型在高速發展中的身份焦慮——既要追趕國際巨頭，又要在本土競爭中脫穎而出。”這種焦慮，或許正是技術迷局的真正底色。

微調紅利與創新困局

華為與阿里的糾紛并非孤立事件，就在上個月，月之暗面與阿里就曾陷入類似的糾紛。

就在外界認為月之暗面要在國產大模型內卷中掉隊之時，其推出的Kimi-Dev-72B在SWE-bench測試中一騎絕塵。

該模型通過1500億專項數據和數百萬GitHub工單優化，將代碼任務準確率提升至60.4%。在當時，它刷新了開源模型的紀錄，將包括DeepSeek在內的眾多競爭對手甩在了身后。

不過好景不長，開發者們很快發現，Kimi-Dev-72B明確標注了其基礎模型為Qwen/Qwen2.5-72B，隨后，開發者社區的分歧迅速蔓延：有人將其視為“站在巨人肩膀上”的微調典范，也有人質疑這是披著開源外衣的“技術組裝”。

微調本是行業常態，但標注的透明性未能消弭質疑。月之暗面官方解釋，他們以Qwen 2.5-72B為起點，收集了數百萬個GitHub問題單和PR提交作為中期訓練數據集，其核心創新點在于采用了大規模強化學習技術。

爭議的核心并非技術本身，而是創新的邊界。Kimi-Dev-72B的表現確實亮眼，但它的成功是否依賴于基座模型的原始能力？有匿名開發者尖銳指出：“如果微調就能達到頂尖水平，原創的價值在哪里？”

開源生態的規則正在被重新定義。阿里通過協議更新試圖維護技術主權，而月之暗面則用性能說話，試圖證明微調并非簡單的“套殼”。市場反應兩極分化：一部分企業開始效仿這種快速迭代的模式，另一部分則呼吁回歸原創研發。

值得注意的是，Kimi-Dev-72B的優化框架確實有其獨特性，它結合了BugFixer和TestWriter角色，通過強化學習精準提升代碼修復和測試編寫的效率。

但這種優化是否足以定義“創新”，仍是一個懸而未決的問題。可見，行業的焦慮感正在加劇，當微調成為捷徑，原創研發的成本和風險是否會被邊緣化？對此，一位風投機構合伙人給出解釋：“資本更傾向于快速見效的項目，原創大模型的投入周期太長。”

失序的競爭

R1的輝煌已成往事，R2的難產卻讓市場陷入焦灼。DeepSeek曾以低成本、高性能對標OpenAI，一度成為全球開源推理類模型的標桿。

截圖來源于DeepSeek官網

傳聞在今年4月發布的R2，時至今日也未能問世，僅僅在5月末推出了一個R1的改款。

至少從6月以來的兩起“套殼”事件來看，改款的R1模型難以承擔定義行業標準的重任。

有媒體爆料稱，因公司創始人梁文鋒對性能的極致追求和H20芯片短缺被迫延期，根據爆料的內部文件顯示，其1.2萬億參數的MoE設計對標GPT-4Turbo，但訓練成本控制成為致命瓶頸。

技術瓶頸之外，行業正面臨更嚴峻的信任危機。R1曾以純強化學習訓練打破技術范式，而R2的缺席讓華為、阿里有望搶占生態位，有風投機構對源Byte表示：“當所有人都忙著給模型‘鍍金’，真正的創新反而成了奢侈品。”

DeepSeek如今已經成為了國產大模型的代名詞，其R1模型具備定義行業標準的意義，但長達半年多的技術缺位、R2接連跳票后，難免有人想取而代之。“對于一線互聯網大廠來說，能夠定義行業標準、引領行業前進方向，才是他們最為看重的。”上述風投機構坦言。

簡單點理解，就是DeepSeek R2的跳票，或變相造成了國產大模型的競爭失焦。

華為和阿里在R2真空期內動作頻頻，華為盤古ProMoE的爭議尚未平息，阿里已悄然推進Qwen-3.0的迭代。兩家巨頭的技術路徑雖有差異，但核心邏輯仍是參數與性能的堆砌，難怪不少匿名開發者都在調侃：“大家都在玩‘誰的數字更大’，沒人關心技術是否真的進步。”

據部分開發者向源Byte爆料稱，部分國產智能體專注“出海”，而非針對國內市場開發，除了國內市場尚未形成付費習慣，還有相當一部分的原因是，國產大模型僅僅在參數上追平或趕超海外模型，但在具體的開發細節上，仍存在一定差距，直接導致開發成本的飆升。

與此同時，芯片短缺加劇了這場混亂。英偉達H20的供應緊張，讓依賴高端硬件的企業陷入被動。DeepSeek的延遲或許只是開始，更多中小廠商可能因資源不足被迫退出競爭。

即便如此，市場對R2的期待仍未消退。傳聞稱其混合專家架構（MoE）將成本大大降低，但具體表現仍是未知數。若R2能如期突破，或許能重新點燃行業的信心；若繼續延遲，國產大模型的競爭格局或將改寫。

耐人尋味的是，這場延遲反而讓市場看清了行業的真實狀態，技術路徑趨同、創新乏力、資源壟斷——這些問題在R2的缺席中被放大。一位從業者無奈表示：“我們需要的不是另一個參數怪獸，而是能真正解決問題的工具。”

部分圖片來源于網絡，如有侵權請告知刪除

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Manus向虎嗅回應：將專注核心業務發展，提升整體運營效率

虎嗅APP 2025-07-09 19:46:13
1 跟貼 1
ChatGPT背后的商業博弈：OpenAI的盈利挑戰與廣告業的拉鋸戰

經濟觀察報 2025-07-09 15:42:34
0 跟貼 0

小米要做中國家電前三，和美的相互學習

每日經濟新聞 2025-05-19 23:45:08
568 跟貼 568

飛書多維表格將支持釘釘和企業微信月活用戶數即將突破1000萬

每日經濟新聞 2025-07-09 11:42:07
0 跟貼 0
中國智駕NO.1，不是華為而是它？

華商韜略 2025-07-08 16:30:49
0 跟貼 0

智駕被華為干出神級操作，問界m9小藝闖紅燈救人？

老孟解讀 2025-07-07 22:58:07
35 跟貼 35

騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
2 跟貼 2
孟晚舟案未了，美再攻華為！介文汲：華為根本不用甩它！

獵馬追聞 2025-07-08 09:56:31
0 跟貼 0

華為黑科技，果然小藝同學，才是真的解放雙手！

夏正經 2025-07-07 17:46:29
1 跟貼 1
讓夜晚帶著光，華為Pura 80系列總有美好

科技鋒說 2025-07-08 09:51:13
1 跟貼 1
余承東：享界品牌車標寰宇中最閃耀的星 #2025享界用戶星享之夜

車市紅點 2025-07-08 21:26:13
8 跟貼 8
華為Pura 80 Ultra黑科技來襲，小藝真能看世界！

趣評測 2025-07-05 21:28:06
0 跟貼 0
李斌稱蔚來自研芯片對全行業開放

金融界 2025-07-07 11:00:35
0 跟貼 0
外媒：局勢逐漸逆轉，臺積電再度聲明，華為未作出回應

環球地理密語 2025-07-07 12:23:31
0 跟貼 0
頂配2.69萬元，華為鴻蒙折疊電腦真機實探

每日經濟新聞 2025-05-19 21:14:35
198 跟貼 198
定義智駕安全新范式中汽中心、清華、華為聯手發布智駕技術白皮書

Autolab 2025-07-09 20:00:48
0 跟貼 0
學校買臺空調花22萬，華為空調是金子做的嗎？那么貴

安國平天下 2025-07-08 23:13:44
0 跟貼 0
充電寶爆炸，華為竟成最大贏家？

小欣聊科技 2025-07-09 11:07:39
1 跟貼 1
短劇疑碰瓷華為、小米：“余程冬”被“驍米集團”挖走，驍米董事長叫蘇柒

紅星資本局 2025-07-09 19:18:11
1 跟貼 1
美女買LV包后上尊界S800 在后座優雅招手關門

速遞新鮮事 2025-07-05 15:03:19
3967 跟貼 3967
雷軍1億搶到的男人，盧偉冰到底有多強？

華商韜略 2025-04-16 18:40:41
0 跟貼 0
「WHYLAB」千萬別拿華為Pura 80 Ultra 去新疆拍照片！

WHYLAB 2025-07-09 20:46:59
0 跟貼 0
從分歧到合作：廣汽與華為在智能汽車領域的戰略轉變

為了更好 2025-07-08 04:56:49
0 跟貼 0
華為智駕有多牛？余承東：事故率下降了90%

極果酷玩 2025-07-09 21:03:45
0 跟貼 0
華為智界車標設計：融合品牌基因與電動化時代的視覺語言

Hi秒懂科普 2025-07-09 12:48:13
0 跟貼 0
余承東回應“開車睡覺”事件，實際是在看手機，自首后被罰款記3分

現代快報 2025-07-09 00:25:11
0 跟貼 0
甲亢哥對克羅地亞粉絲喊冷靜，直播展示華為手機

現代快報 2025-07-09 16:09:03
0 跟貼 0
華為宣布鴻蒙游戲將亮相ChinaJoy

每日經濟新聞 2025-07-08 12:52:24
0 跟貼 0
智元機器人要來A股了！公司聯合創始人曾是華為“天才少年”

每日經濟新聞 2025-07-09 13:56:38
0 跟貼 0
華為Pura 80系列設計解析：跨文明的美學對話

愛范兒 2025-06-28 16:14:58
0 跟貼 0
比爾·蓋茨：對中國技術封鎖起反效果

財聯社 2025-05-12 21:33:06
0 跟貼 0
從行業翹楚到一夜崩塌：羅馬仕倒閉背后的質量與誠信缺失

烽火三月佳人三千 2025-07-09 03:15:03
0 跟貼 0
何小鵬和雷軍真正的塑料兄弟

雷科技 2025-06-06 21:23:05
0 跟貼 0
以五維安全體系構筑基石，中汽中心、清華、華為聯合發布智駕技術白皮書

財聯社 2025-07-09 21:22:06
0 跟貼 0
不止有華為光環！嵐圖FREE+舒適值也更高了

My車轱轆 2025-07-08 17:58:05
0 跟貼 0
比亞迪李云飛：要忙在正道上，拒絕陰陽

每日經濟新聞 2025-06-06 17:55:12
240 跟貼 240
當初余承東第一個找到廣汽，希望與廣汽合作，被廣汽董事

眼淚落盡良人歸 2025-07-07 16:29:51
4 跟貼 4
AI版三個臭皮匠！ChatGPT/Gemini/DeepSeek合體拿下AGI測試最高分

量子位 2025-07-08 17:03:21
5 跟貼 5
比亞迪版圖大起底，實力超乎你的想象

華商韜略 2025-02-11 17:11:11
124 跟貼 124
DeepSeek-R1超級外掛！“人類最后的考試”首次突破30分

量子位 2025-07-09 13:24:11
18 跟貼 18

源媒匯

匯聚上市公司風云，深耕金融、汽車、大消費、醫藥、科技、游戲等領域，挖掘財經深層價值。

842文章數 63關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

旅游

健康

家居

數碼

手機 / 數碼

房產 / 家居

改款DeepSeek，亂了華為心態

下一任蘋果CEO，可能是這位iPhone的掌舵人

小區地下車庫排風管墜落 女子車玻璃被砸穿人嚇到發抖

小區地下車庫排風管墜落 女子車玻璃被砸穿人嚇到發抖

東亞杯-姚偉傳射+世界波邵子欽頭槌 女足2-2韓國

周杰倫開抖音號瘋漲三百萬粉絲

金店業績分化 為何"一口價"賣得更好了？

比亞迪為智能泊車安全兜底 天神之眼全面OTA升級

態度原創

選來選去還是這些穿搭最適合夏天！不老氣橫秋，舒適又大方

熱聞|清明假期將至，熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言！

以光為境 國寶花園別墅

宏碁 2025H1 營收同比增長 1.5%，6 月臺式機營收同比提升 19.3%

小區地下車庫排風管墜落女子車玻璃被砸穿人嚇到發抖

小區地下車庫排風管墜落女子車玻璃被砸穿人嚇到發抖

東亞杯-姚偉傳射+世界波邵子欽頭槌女足2-2韓國

金店業績分化為何"一口價"賣得更好了？

比亞迪為智能泊車安全兜底天神之眼全面OTA升級

以光為境國寶花園別墅