“當下,我們更需要大模型的“通才”還是“專才”?
2024至今,中國通用大模型領域正經歷前所未有的高速發展與激烈競爭。
從阿里巴巴的通義千問到字節跳動的豆包大模型,再到百度的文心一言和騰訊的混元大模型,大廠們紛紛推進技術創新和商業落地。在數智化轉型浪潮中,這四家立于潮頭的企業是整個中國通用大模型的縮影。
通過梳理這四家代表企業的戰略布局、產品創新、資金研發投入及市場表現,我們可以窺見中國企業如何迎接挑戰與機遇,又如何在全球AI競賽中摸索前進。
中國通用大模型 巨頭的競速
“數智化轉型”代表著數字化、網絡化與智能化的深度融合,旨在驅動經濟社會范式的根本性變革 。
在這一轉型浪潮中,通用大模型已成為核心驅動力, 通用大模型模型參數量往往在百億到萬億之間,接受過系統“通識教育”的全才。通過微調或提示工程,通用模型可以執行包括文本生成、翻譯、問答、代碼生成、推理在內的多項任務。
2024年至2025年被視為通用大模型發展的關鍵時期,標志著該領域從技術探索階段邁向規模化應用階段 。市場數據顯示,中國AI大模型市場規模在2024年已達到約294.16億元人民幣,并預計到2026年將突破700億元人民幣 。這種高速增長不僅體現了企業和消費者對AI技術日益增長的采納度,也預示著大模型技術正從實驗室走向廣泛的商業實踐。
市場擴張的背后,是國家層面的戰略引導和地方政府的積極支持。“AI+”戰略已被寫入政府工作報告。在地方上,北京、上海、杭州、廈門等多個城市陸續出臺鼓勵人工智能發展的政策。
同時,開源生態的繁榮成為中國技術突圍的關鍵路徑。以阿里通義實驗室為例,其阿里已開源200多款模型。而通義千問Qwen衍生模型數量已突破10萬,超越美國Llama模型,成為全球第一AI開源模型。
強有力的政策支持和開放的環境,推動中國大模型領域的技術發展趨勢與全球前沿保持同步,并在多個方面展現出獨特的適應性與創新。
阿里的通義千問正積極布局多模態基礎模型 ,劍指構建“云-模型-應用”全棧AI布局,并積極擁抱開源;字節的火山引擎,用極致性價比與規模效應猛沖,張一鳴親自參與AI戰略制定,以激進的低價策略搶占市場份額,推動模型和應用的大規模普及;百度喊出“All in AI”口號,基于原有業務如百度搜索、智能駕駛等進行布局;騰訊的混元大模型則將大模型的研發與能力和騰訊業務深度結合,廣泛應用于微信、QQ、騰訊元寶、騰訊會議、騰訊文檔等核心產品。
過去一年,中國通用大模型領域的競爭格局日益激烈,以阿里巴巴、字節跳動、百度和騰訊為代表的科技巨頭,正通過差異化的戰略布局和產品創新,在技術前沿和商業落地方面展開全面競速。
阿里巴巴的通義千問(Qwen)圍繞“云-模型-應用”全棧AI戰略,專注于多模態基礎模型和AI智能體研發,旨在構建端到端的AI解決方案 。產品創新方面,通義千問發布了包括Qwen2.5-VL(視覺理解)和Qwen2.5-Max等模型,并不斷優化文生圖模型,如通義萬相2.1已于2025年1月升級推出視頻生成模型,并在權威評測榜單VBench中位居榜首 。
2025年3月,阿里巴巴發布并開源了輕量級智能體QwQ-32B,其能在消費級GPU上運行,這符合全球模型效率提升和廣泛部署的趨勢 。面向消費者市場,夸克App作為阿里巴巴AI To C的核心產品,整合了對話、深度思考、搜索、研究、執行等多元AI功能,成為其用戶觸達的重要載體 。
值得注意的是,阿里巴巴集團宣布未來三年將持續投入超過3800億元人民幣(折合數百億美元),用于云和AI硬件基礎設施建設,創下中國民營企業在該領域有史以來最大規模的投資紀錄 。市場表現方面,通義千問Qwen3開源僅一個月,全球累計下載量便突破1250萬次,成為近期最受歡迎的開源模型之一 。
其旗下夸克App在2025年1月的平均日活躍用戶(DAU)達到3369萬,位居中國AI應用榜首 。阿里云(包含通義千問)在中國模型調用量市場中約占19.3%的份額,并在2024年中國AI基礎設施(AI IaaS)市場中以23%的份額位居第一 。
字節跳動的豆包大模型采取“極致性價比與規模效應”的激進策略,在市場上攻城略地。在2025年3月的日均Token調用量達到12.7萬億次,同比增長近100倍。其在中國公有云大模型服務調用量市場份額高達46.4%,超越阿里云和百度智能云的總和,使其成為中國最受歡迎的AI產品之一 。
在其產品序列中,基于混合專家(MoE)架構的豆包·深度思考模型表現尤為突出,該模型總參數量達2000億,但每次推理時僅激活200億參數,值得注意的是,這個模型實現了低至20毫秒的推理延遲,并將推理成本較傳統方案降低了80% 。
截至目前,豆包已支持超過50種應用場景,覆蓋30多個行業 ,火山引擎成為少數逆勢擴招的中國云廠商之一,擁有超過1萬名產品和研發人員以及近2000名銷售和運營人員 。
而喊出“All in AI”口號的百度,則將大模型與其原有業務緊密結合。百度搜索結果頁中已有22%的內容由AI生成,文庫、自動駕駛等同樣成為百度的主要發力方向。數據顯示,百度智能云的AI相關收入在2024年第四季度增長近300%,整體營收同比增長26% ,文心大模型在2024年12月的日均調用量達到16.5億次,相較于2023年末增長了33倍,百度文庫AI功能的月活躍用戶數在2024年12月達到9400萬,同比增長216% ,百度自動駕駛出行服務平臺Apollo Go在2024年第四季度提供了110萬次乘車服務 。
騰訊則依托其強大的內容生態,打造了國內首個多模態領域開源大模型。自2024年全面開源以來,混元大模型覆蓋文本、圖像、視頻和3D生成等多模態。混元大模型作為國內首個采用MoE架構的萬億參數大模型,通過動態路由機制實現計算資源優化;通用任務調用3—5個專家模塊,專業任務激活“15+”模塊;推理效率較密集架構提升3倍,訓練成本降低40%。
騰訊混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多個版本,目前已接入700余個騰訊業務和場景(如騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等)及騰訊旗下協作SaaS (軟件即服務)產品,為業務賦能。以騰訊元寶為例,這款應用的日活躍用戶在2025年2月至3月期間激增了20多倍。
數智化轉型中的大模型賦能與產業變革
毫無疑問的是,通用大模型作為大模型的基石,正在多方面重塑中國的數智化轉型,其影響深遠且廣泛。
借助混合專家(MoE)架構和先進注意力機制,大模型顯著提升了生產效率與管理水平。例如,豆包實現了低至20毫秒的推理延遲和80%的成本降低 ,這直接將技術效率轉化為實際運營效益,使得企業能夠更快地做出決策并實現流程自動化。隨著模型 “思考”能力的增強,大模型能夠執行更復雜的邏輯、數學和規劃任務,進而驅動產品與服務創新。通用大模型幾乎已經成了“標配”,在工業、交通、能源等眾多行業得到了廣泛應用。
比如說,在政務領域,西湖區依托阿里云“通義千問”大模型開發的“西小服”AI專員,整合了全區17.6萬家企業的數據標簽,精準匹配政策并實現訴求的智能流轉。通過“浙里辦”入口,企業可實時獲取政策推送、在線申報及進度查詢服務。
在醫療領域,騰訊與明德醫療合作開發了全球首個針對重癥監護病房的人工智能醫療模型,名為啟元重癥大模型,目前已在國內部分醫院進行臨床試驗。
在能源領域的礦山安全場景中,文心4.5 Turbo準確識別掘進機作業畫面中的誤闖人員。該模型通過大小模型協作架構,在礦山邊緣側先用小模型初判,再觸發大模型二次校驗,實現準確率與經濟性的平衡。
不只是在B端,通用大模型同時也在賦能C端應用的發展,阿里夸克、字節豆包、騰訊元寶已經牢牢占據了前三的位置。阿里夸克月活更是已經過億,超級AI應用的鋒芒已經顯露。
可以說,中國大模型行業正處于一個重要的戰略機遇期,這背后是多重有利因素的匯聚:
中國擁有龐大的人口基數和快速發展的數字經濟,為大模型提供了廣闊的應用場景和用戶群體。從消費級應用到企業級解決方案,各行各業對智能化升級的渴望,構成了大模型發展的肥沃土壤;
作為全球最大的互聯網市場之一,中國積累了豐富的文本、圖像、語音等多模態數據,這些數據為大模型的訓練和優化提供了寶貴的“燃料”;
而國產化替代趨勢,又為本土大模型企業帶來了獨特的發展機遇 ,隨著中國對核心技術自主可控的需求日益增長,國內企業不斷加大研發投入,推動底層技術創新,并積極構建自主可控的AI生態系統。
但不得不客觀的說,通用大模型的發展并非一帆風順,仍有多重挑戰需要面對。
通用大模型的研發、訓練和部署需要巨大的資金投入,尤其是在算力、人才和數據方面。然而,許多應用場景的商業化模式尚不成熟,投資與回報仍存在巨大的落差。另外,盡管通用大模型雖然看似是“通才”,但其在各行各業的落地往往呈現出零散、定制化的特點,企業需要強大的工具、服務和專業知識來在現有IT基礎設施和業務流程中定制、集成和管理這些模型,使得大模型規模化落地變得困難。
不可忽視的一點是,這些巨頭們在通用大模型領域的布局非常深厚,投入在人才、算力等方面的資金,是一個天文數字。這既是優勢又是劣勢,大模型技術路線不斷發生著變化,正所謂船小好掉頭,往往一個新技術的突破,就能瞬間消解巨頭們的能力優勢。最典型的就是Deepseek的橫空出世,包括智譜AI、kimi等新興力量的崛起,都在昭示著這么一個信息:通用大模型不只是巨頭們的賽場。
中國大模型加速追趕國際領先模型
從2024年開始,我國頭部大模型加速追趕國際領先模型(如GPT-4o、Claude 3、Gemini等)。在一些特定測試基準和中文能力上,國產模型甚至有所超越 。
由斯坦福大學李飛飛團隊編撰《2025年人工智能指數報告》指出,美國在人工智能研究和模型開發領域長期占據主導地位,中國則穩居第二。然而,最新證據表明,這一格局正在快速變化,中國開發的模型正逐步趕超美國同行。2023年,美國領先模型的性能顯著優于中國模型。在LMSYS Chatbot Arena平臺上,2024年1月,美國頂尖模型的表現比中國最佳模型高出9.3%。但到2025年2月,這一差距已縮小至僅1.70%。2023年底,在MMLU、MMMU、MMATH和HumanEval等比較基準中,中美模型的性能差距分別為17.5、13.5、24.3和31.6個百分點。而到2024年底,這些差距已大幅縮小至0.3、8.1、1.6和3.7個百分點。然而,結構性差異依然存在。美國在復雜推理和數學能力上保持技術縱深,例如OpenAI的O1模型在理科任務得分達87.3分,顯著高于中國模型的72.0分。
性能加速追趕的同時,成本優勢急劇攀升。
數據顯示,國產領先大模型平均每百萬Token調用成本顯著低于國際水平,平均為38.2元人民幣/百萬Token,而國際平均為158.3元人民幣/百萬Token,這意味著國產模型擁有近5倍的成本優勢 。
換言之,國內企業能夠以更具吸引力的價格提供性能相差不大的服務,尤其是在一個高度重視效率和實際應用的市場中。這種成本效益不僅促進了國內市場的普及,也可能對全球LLM API定價產生下行壓力,從而加速基礎LLM服務在全球范圍內的商品化進程。
國產通用大模型領域的快速發展,正成為推動中國數智化轉型的新引擎。盡管面臨算力、數據、商業化等多重挑戰,但政策的強力支持、市場的巨大潛力以及企業間的創新博弈,國產大模型有望在全球AI競賽中占據更重要的地位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.