網易首頁 > 網易號 > 正文申請入駐

通義千問，快成國產AI掃地僧了

2025-03-11 17:40:49　來源: 深水研究

北京舉報

分享至

熟悉筆者的朋友都知道，過去一年來，只要有人問及最常用的AI助手是哪個？通義千問一定會是我給出的前三名推薦應用中的一個。

哪怕到了DeepSeek-R1發布之后，情況也并沒有發生變化。

對于一個科技產業觀察者、AI應用高頻用戶來說，DeepSeek在文本能力、深度思考多元性等許多方面的表現確實足夠出色。但我近期已經在多個場合都不斷強調過，通義、文心以及元寶在數據可靠性和大模型幻覺率上，可以說直接吊打DeepSeek。但這一點并未得到足夠的大眾認知。

多少令我意外的是，每當我在AI高頻使用名單中列出通義千問時，絕大多數朋友的第一反應都是：誰？

除了產品認知度之外，在技術能力的認知維度，通義千問更是非常可惜。

且不說作為全球前四名的云計算公司、阿里云多年來在云計算領域擁有雄厚的技術能力積累，回顧百模大戰時期，通義千問彼時也是彼時真正意義上可以與ChatGPT3.5媲美的國產AI。但幾乎沒有人知道這一點。

到了今年情況也沒有變好。

就在充滿爭議的Manus出圈當天，阿里通義千問團隊推出了最強本地運行國產大模型QwQ-32B，參數僅為DeepSeek R1的1/21，成本僅1/10。但其性能卻能與之媲美，甚至在某些測試中超越了 DeepSeek R1。這意味著，用戶可以用更低的成本，在本地輕松運行性能卓越的大模型。

不過，由于Manus內測客觀上造成的饑餓營銷聲勢，國內幾乎沒有人關注QwQ-32B的這一革新。哪怕在海外反應都比國內要強。

“下一個顛覆全球人工智能（AI）產業的DeepSeek也可能來自中國。”3月6日，美國彭博社在其一篇報道中如是說,文章并沒有提到國內關注的Manus，而是提到阿里通義千問當天發布了全新推理模型QwQ-32B。

而且，后來Manus創始人季逸超在社交平臺透露，Manus產品使用了不同的基于阿里千問大模型（Qwen）的微調模型。相當于承認了套殼Qwen。

但到了這時候，已經沒有什么人關注這一點了。從國內市場反饋來看，通義千問再一次錯失了建立用戶心智的關鍵時刻。

在2025年AI to C這場混戰中，可能是由于DeepSeek帶來的沖擊過于強大，以至于大家一時間都忘記了自己本來的優勢到底是什么。

從元寶近期鋪天蓋地的造勢來看，騰訊已經反應過來。

但誰能想到，當初號稱擁有最強公關天團的阿里，卻在AI時代輸在自己的最長板——市場營銷上。

2025

AI賽點一：用戶心智

列一組數據，就會知道通義千問一段時間以來在市場占有率上的掉隊。

據AppGrowing數據，截止2024年11月15日，Kimi、豆包、星野、元寶等國內十款大模型產品，今年合計投放超625萬條廣告，投放金額達15億元。今年1月也有機構統計稱，2024年，頭部AI公司在廣告投放總額突破20億元，其中Kimi一家就投入了5.4億元。

而從市場推廣的角度來看，作為阿里旗下的拳頭產品，通義居然是墊底式的存在。

這是去年10月有媒體統計的各家大模型的市場投放費用參考，通義千問以450萬元成功墊底。

但很快通義千問辟謠稱：

來自官方的吐槽更加能展現通義的尷尬局面。畢竟，作為阿里巴巴旗下的重磅AI產品，內部趕不上新起之秀夸克，外部趕不上元寶、豆包這些同級別大廠產品，更不要說和Kimi這樣的營銷大神相提并論。

DeepSeek一分錢不花就震撼全球的情況畢竟可遇而不可求。市場很快給出了反饋。營銷投入直接影響了用戶數量，有機構統計的訪問量數據。

盡管在市場認知度和占有率上通義千問掉隊，但這并不意味著通義千問技術實力差。

通義千問在多個國際公認的基準測試中表現出色，例如在MMLU、TheoremQA以及GPQA等評測指標上超越了Llama 3 70B，并在Hugging Face的Open LLM Leaderboard上登頂。

今年1月底，阿里發布了AI基礎大模型千問旗艦版Qwen2.5-Max，在多項權威基準評測中處于業界領先水平。

2月21日，全球開發者大會（GDC）上，據阿里巴巴通義實驗室科學家黃斐介紹，到目前為止，整個通義千問（Qwen）系列模型的下載量達到了1.8億，累計衍生模型總數達到9萬個，衍生模型數已經超越Meta的Llama系列，成為了全球第一大開源模型系列。

其實早在2019年云棲大會上，阿里就已經宣稱已經成為中國最大的AI公司。每天AI調用超1萬億次，服務全球10億人，日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句。

一定意義上，阿里才是AI時代最早趕集的那一個。而且，市場營銷本來應該是電商起家的阿里最長板。

遺憾的是，在AI成為下一個世代入口級產品的時刻，阿里拿了一手好牌，卻根本不出牌。

賽點二：

靠譜將成為最重要的評測標準

在人工智能這一長坡厚雪級賽道上，DeepSeek雖然領先，但大廠們其實擁有目前創業公司無法比擬的優勢。

而其中最關鍵的優勢其實不是創新能力，而是靠譜能力。

起碼到目前為止，目前大廠旗下的AI都沒有出現給我編造數據和事實的情況，所有的發言都有跡可循。相比之下，DeepSeek對我來說已經是劣跡斑斑。

舉個例子，卡爾·貝內迪克特·弗雷在其《技術陷阱》一書中提到了19世紀因為電燈誕生影響煤氣燈點燈工人的罷工事故。由于我好奇這段史實，于是讓DeepSeek幫我詳細復盤當時由于新技術出現所帶來的失業沖擊問題。

結果它不僅給我編造了當時的工人集合現場畫面，還信誓旦旦地給出了當時媒體《倫敦新聞畫報》曾預言“電燈將讓黑夜消失，人類將無所事事”，不僅如此，還稱倫敦的點燈人工會在1905年轉型為英國電氣工程師協會。

從文本上來說，“電燈將讓黑夜消失，人類將無所事事”這樣的性感表達一定會得到絕大多數人的喜歡和青睞。

但遺憾的是，后來我在通義、文心、混元、谷歌、必應以及百度等多個渠道搜索發現，人類記載中從未出現過當時集合的事件，《倫敦新聞畫報》也從未有過這樣的評價，至于英國電氣工程師協會也沒有點燈人工會的歷史關聯。

這是非常可怕的事情——如果我不是對科技傳播史領域有一定了解，我可能永遠無法識別DeepSeek的謊言。

而面對如此強大幻覺的DeepSeek，本身在數據和表達嚴謹性具有強大優勢的絕大多數大廠AI，卻集體失聲了——這本來應該是一個絕佳的專業用戶心智營銷點。

相比之下，大廠的靠譜就凸顯出來了。同樣的問題，通義千問的回答沒有出現任何幻覺。引用資料包括類似2022年《財經》雜志對《技術陷阱》一書的書評等，信源要相對可靠的多。

不過從目前來看，目前并無國內的AI廠商把幻覺率優化作為大模型競爭力的重要標準。相反，接入DeepSeek成為了一種新的商業正確。

但問題是，一個不準確、胡編亂造的AI，真的有應用價值嗎？所以可以預期的是，2025年AI應用大戰的一個關鍵賽點一定會是大模型的幻覺率。

從這個角度來說，通義還有一定的反超機會——前提是在市場營銷得當的情況下。

賽點三：

To B VS To C的不同選擇

眾所周知，阿里的前沿科學研究機構被命名為阿里達摩院，而其中的科學家也被稱為掃地僧。這一稱呼的典故源自金庸的武俠小說《天龍八部》。文中少林寺藏經閣有一位看似普通實則武功深不可測的掃地僧。

但在這個連馬斯克都需要不斷在X上刷存在感的流量時代，沒有存在感這件事情，對于一家AI廠商來說，正在變得越來越危險。

目前來看，通義千問最大的優勢還是在于B端。

和to C的失意不一樣，作為開源大語言模型系列，通義千問在開發者社區中受到熱烈歡迎，其靈活的定制能力使得開發者可以根據自身需求對模型進行調整和優化，因此非常適用于科研和技術開發領域。

3月10日，國家超算互聯網平臺接入阿里巴巴通義千問大模型,對外提供千問QwQ-32B A-PI 服務。此前蘋果選擇阿里作為中國區AI合作伙伴，足以證明其在to B領域的服務能力。

而且，從通義的廣告投入方向來看，to B應該是在資源極其受限的情況下主動押注的選擇。

而這與模型的性能和幻覺率是一脈相承的。to B領域無法容忍幻覺的存在。因為一旦AI發生幻覺，影響的就可能是工作流和生產流水線的排期規劃，甚至可能會造成難以估量的巨大損失。

可是即便在企業服務領域領先，但生成式AI是一個高度需要訓練和涌現的領域，當場景受限時，商業想象力也會大大受限。

而從To C市場的“先發劣勢”角度來說，通義千問堪稱AI界的掃地僧。

但此時畢竟是一個重新劃分新地圖的時刻，缺位和無聲，其影響是難以預測的。

相比之下，夸克的想象空間可能要更大一些。

在2023年11月，阿里巴巴智能信息事業群發布了全棧自研、千億級參數的夸克大模型，應用于通用搜索、醫療健康、教育學習、職場辦公等場景。之后，夸克App確立了以AI搜索為核心一站式AI服務的定位。

到了2024年，夸克的勢頭明顯超過通義。阿里顯然也看到了在C端應用上的結構性變化，選擇在2024年12月初做出了調整，把AI應用“通義”App從阿里云分拆，并入阿里智能信息事業群。從而讓夸克和通義 App成為智能信息事業群并行發展的兩個品牌。

但阿里通義實驗室和旗下通義大模型沒有任何變化。

這意味著， “通義”的底層技術與產品應用團隊將實現分離，由阿里巴巴智能信息事業群總裁吳嘉扛起AI 在C端應用的重擔。

結構調整之后，今年3月，通義App進行了大幅度的改版，除了接入阿里最新的開源推理模型通義千問QwQ-32B之外，在產品交互界面和形態上也進行了升級。通義App的默認對話對象開始走豆包的路線，

從此前的跟隨ChatGPT的幾何形狀變成了一個留著“齊肩短發”的鄰家女孩。這也證明，通義并沒有放棄To C市場。

2025年AI to C領域必然還會有一場惡戰。

接下來就看新的通義團隊能否讓曾經的掃地僧，進化成為名門正派的少林寺方丈了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

深水研究

專注數字化與全球化。

49文章數 5關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

教育

手機

健康

時尚

手機 / 數碼

房產 / 家居

通義千問，快成國產AI掃地僧了

22年后，馬斯克“殺死”了最初的特斯拉

媒體：在伊朗與以色列的沖突中 伊拉克的態度耐人尋味

媒體：在伊朗與以色列的沖突中 伊拉克的態度耐人尋味

被偷走的世界杯資格 他們用20年搶回來了

郭富城官宣方媛懷三胎 拒絕透露性別

大廠搶灘的「穩定幣」，能火多久？

前臉與N7相似 新一代日產軒逸假想圖曝光

態度原創

又一城購房補貼！買房就發錢，正在海南樓市瘋狂擴散！

2024智慧家長家教好故事展播（三十六）

iPhone 17 Pro發布三個月倒計時！12項配置升級：首次堆散熱、12GB內存

呼吸科專家破解呼吸道九大謠言！

今年最流行的5雙鞋，配闊腿褲太好看了！

媒體：在伊朗與以色列的沖突中伊拉克的態度耐人尋味

媒體：在伊朗與以色列的沖突中伊拉克的態度耐人尋味

被偷走的世界杯資格他們用20年搶回來了

郭富城官宣方媛懷三胎拒絕透露性別

前臉與N7相似新一代日產軒逸假想圖曝光