核心觀點:
- 為突破Transformer算法結構計算復雜度高、訓練推理成本高昂、多模態處理能力不足等局限,近年來MoE、多模態模型、Diffusion模型等算法架構得以重視,剪枝、稀疏、蒸餾等推理優化技術應運而生。
- 目前,AI Agent正成為大模型應用熱點方向之一,用于智能體之間通信協作的協議,比如MCP、A2A,逐漸興起。
- 2024年全球大模型融資超1,800億人民幣,60%資金流向應用層;應用落地呈現“微笑曲線”,多模態成主流方向。金融、醫療滲透率超50%,同時應用集中于高附加值環節,如研發設計+營銷服務。
- 全球范圍內,2024年大模型市場規模超280億美元,未來五年復合增速或達到36.23%,2028年有望超過1,000億美元。
- 中美模型性能差從2024年1月的9.26%縮至2025年2月的1.70%,國產模型如DeepSeek-V3以1/8成本逼近GPT-4o。
- 國內形成“互聯網巨頭+創業六小強”格局,百度文心、阿里通義深耕中文場景,智譜GLM、DeepSeek開源模型下載量超2億次,推動AI平權。
(1)定義
人工智能(AI)大模型指利用深度學習算法讓計算機從復雜數據集中自動提取關鍵特征并做出精準決策的具有超大參數規模的模型。
(2)特征
AI大模型具有泛化性(知識遷移到新領域)、通用性(不局限于特定領域)以及涌現性(產生預料之外的新能力)三大特征。
(3)類型
從應用范圍劃分,大模型主要分為通用大模型和行業大模型;從開放程度劃分,大模型主要分為閉源和開源;從模態類型劃分,大模型主要分為單模態、多模態、跨模態等。
圖1:中文大模型類型劃分
來源:融中咨詢
(4) “智力”來源
大模型的智力是數據、算法、算力、訓練方法共同作用的產物,其核心機制可歸納為四個:Transformer算法、Scaling Law、涌現能力、預訓練和微調。
Transformer算法:當前主流大模型普遍是基于Transformer算法進行設計的。Transformer的核心優勢在于具有獨特的自注意力(Self-attention)機制,能夠直接建模任意距離的詞元之間的交互關系,解決了循環神經網絡(RNN)、卷積神經網絡(CNN)等傳統神經網絡存在的長序列依賴問題。
Scaling Law:它描述了模型性能與規模因素之間的冪級關系。在一定范圍內,如果增加參數量、訓練數據量或計算量,那么模型的損失(例如困惑度 Perplexity)會按冪律下降,性能線性或超線性提升。換句話說,“越大越聰明”。
涌現能力:隨著模型參數規模、數據量等達到某個臨界點,模型突然表現出小模型無法實現的新能力,這些能力不是逐漸出現的,而是非線性地“躍遷”出來的,即模型在理解和解決復雜任務時發生質變,展現出類似人類智能的推理、泛化和創造能力。
預訓練和微調:大模型通常采用預訓練和微調的策略。預訓練階段,模型在大量無標注數據上進行自監督學習,掌握語言的通用表示;微調是在預訓練基礎上,用特定任務或特定格式的數據對模型再訓練,以獲得更專用、更準確的能力,以適應具體任務需求。
(5)典型創新技術
為突破Transformer算法結構計算復雜度高、訓練推理成本高昂、多模態處理能力不足等局限,近年來MoE、多模態模型、Diffusion模型等算法架構得以重視,剪枝、稀疏、蒸餾等推理優化技術應運而生。
1)算法架構
MoE(專家混合模型):通過引入“稀疏激活”的專家模塊,在每次向前推理時只激活部分專家網絡,解決了“大模型 = 高推理開銷”的難題;
多模態模型:引入圖像、音頻、視頻等感知能力,在一個模型中融合處理多種模態信息,實現“看圖說話”、“讀圖寫代碼”、“音視頻理解”等能力;
Diffusion(擴散)模型:強調可同時生成多個Token,并能于生成過程中持續修正內容,如Google Gemini Diffusion在部分文字生成任務的運算速度有著明顯提升,官方資料最高平均達每秒1,479 Token,明顯高于Gemini 2.0 Flash-Lite等傳統模型。
2)推理優化
剪枝:在訓練后去除對輸出影響小的參數或連接,例如低權重神經元、通道或注意力頭,減少了模型體積與計算需求。
稀疏:只激活部分神經元/專家節點,而非全部參數參與運算(如MoE架構)。在大參數量模型中實現計算量線性縮放,顯著降低推理成本。
蒸餾:用一個大模型(教師模型)的輸出結果訓練一個小模型(學生模型),讓小模型學習大模型的“軟目標”分布。蒸餾大幅減少參數與計算量,同時保持接近的準確度。
1)發展簡史
自從20世紀50年代圖靈測試被提出以來,人類一直在探索如何用機器掌握語言智能。作為一種主要的語言理解和生成方法,自然語言處理模型(Natural Language Processing,NLP)在過去的二十年中得到了廣泛的研究,并從統計語言模型逐步發展為神經語言模型。從2022年開始,大模型行業呈現爆發式增長。
圖2:語言大模型發展歷史及代表性里程碑事件
來源:DeepSeek技術社區
Transformer的引入(2017年):2017年,Vaswani等人通過其論文“Attention is All You Need”引入了Transformer架構,解決了早期模型如循環神經網絡(RNNs)和長短期記憶網絡(LSTMs)的關鍵限制,為現代大型語言模型奠定了基礎。
推進式對話AI——ChatGPT(2022年):2022年3月,OpenAI推出了GPT-3.5,相比于GPT-3,訓練和微調有所改進。基于GPT-3.5和InstructGPT,OpenAI于2022年11月推出了對話式AI模型——ChatGPT,大模型開始向C端用戶普及。
多模態模型的問世(2023年):2023-2024年,像GPT-4V和GPT-4o這樣的多模態大型語言模型,實現了將文本、圖像、音頻和視頻整合到統一系統中。這些模型擴展了傳統語言模型的能力邊界,實現了更豐富的交互手段和解決更復雜問題的能力。
推理模型快速發展(2024年):2024年9月,OpenAI發布的o1-preview大模型標志著人工智能的一次進步,尤其是在解決復雜推理任務(如數學和編程)方面。2025年1月,OpenAI發布o3,它在編程、數學、知識問答等領域都打破了o1創造的紀錄。
2)未來趨勢:行業應用與AI智能體
目前,AI Agent(人工智能自主智能體)正成為大模型應用熱點方向之一。它是一種能夠獨立思考、感知環境、進行決策和執行動作的智能實體,其底層架構邏輯可以概括為:“大模型+插件+執行流程/思維鏈”。
隨著多智能體協作場景的日益重要和復雜,用于智能體之間通信協作的協議,比如MCP、A2A,逐漸興起。
(1)政策環境
在國家層面,政府陸續發布了支持大模型行業技術研發、標準化體系建設和數據要素開發等層面的政策方針,旨在推動大模型在工業、醫療等領域的應用。政策總體注重安全合規與技術創新的平衡,引導產學研協同發展。
表1:中國AI大模型行業相關扶持政策
來源:融中咨詢
(2)融資動態
1)全球
基于《2024年大模型融資全景》數據,2024年下半年全球大模型產業鏈上下游共94起融資事件,總融資額超1,800億人民幣。其中關于各類大模型研發廠商的融資事件共84起,其余事件主要為產業鏈上游基礎設施和安全系統提供商。
圖3:2024H2各類大模型企業融資數量占比
來源:融中數據
2)中國
2020-2022年,國內大模型投融資事件數量未超過5起,總額均不超15億。2023年有20起,投融資金額為64.27億元。
到了2024年,全面爆發,全年共118起融資事件,總額超620億元。
2025年Q1人工智能領域合計發生融資案例241起(不含未公開事件),合計涉及融資金額181.4億元(僅統計已披露的融資金額)。
圖4:2020-2025Q1大模型行業投融資事件數量、金額變化情況
來源:融中數據
分區域來看,北京、廣東、上海、浙江、江蘇等地的融資案例數和金額排名靠前。2025年Q1融資案例數前五的地域是北京、廣東、上海、浙江和江蘇,合計205起,占比85.1%;融資金額方面,2025年Q1融資金額前五的地域是北京、上海、廣東、浙江和江蘇,合計168.5億元,占比92.9%。
圖5:2025Q1國內大模型融資地區金額分布
來源:融中數據
從融資階段來看,國內AI大模型企業仍以早期為主。早期融資案例(種子輪至A輪)占比由2024年Q4的67.0%小幅上升至2025年Q1的67.2%,早期融資金額占比由2024年Q4的31.6%上升至2025年Q1的45.1%。中后期(B輪至Pre-IPO輪)融資金額占比由2024年Q4的50.4%下降至2025年Q1的40.2%,戰略融資的融資金額占比由2024年Q4的17.9%下降至2025年Q1的14.8%。
圖6:2025年第一季度國內融資金額對應輪次占比
來源:融中數據
(1)產業鏈結構與角色分布
大模型產業鏈是一個涵蓋硬件基礎設施、數據與算法服務、模型研發及行業應用的多層次生態體系。
上游:主要由算力設施、數據服務商和算法供應商構成,為模型訓練提供計算資源與數據基礎。
中游:聚焦于大模型的研發與優化,包括通用大模型和垂直行業大模型的開發,企業通過深度學習框架進行預訓練與微調,形成文本、圖像、多模態等生成能力。
下游:是產業鏈的核心,滲透至醫療、教育、政務、工業等千行百業,通過行業大模型解決特定場景問題,如智能客服、輔助診斷、生產優化等。
圖7:大模型產業鏈圖譜
來源:融中咨詢
(2)行業市場規模
大模型的市場規模近年來呈現爆發式增長,全球范圍內,2024年大模型市場規模超280億美元,未來五年復合增速將達到36.23%,2028年有望超過1,000億美元。其中美國占據主導地位,其基礎大模型發布數量占比達69%,中國和英國緊隨其后[1]。
圖8:全球大模型市場規模(億美元)
來源:浙商證券研究所
根據我國工信部數據,2023年全年我國語言大模型市場規模實現較快提升,應用場景不斷豐富,增長率突破100%,初步統計,2024年中國市場規模超過200億元,2028年市場規模有望超過1,000億人民幣[1]。
圖9:中國大模型市場規模(億人民幣)
來源:浙商證券研究所
(3)商業模式
大模型的商業模式多樣且持續演進,主要包括基于用量的API調用收費、訂閱制、廣告收入、平臺生態模式收取使用費及分成,以及定制化服務(MaaS)等核心形式。
從商業化結構來看,B端變現模式更加清晰,C端大多數產品仍然以免費為主。雖然純B端市場占比只有31%,但80%以上的產品均能實現營收;純C端用戶占比50%以上,但43%的產品當前仍未有明確的收入模式,以免費為主[2]。
圖10:AI應用面向用戶群體結構
來源:融中咨詢
圖11:AI應用面向用戶收費模式
來源:融中咨詢
從應用場景來看,當前通用場景中的主流盈利模式是通過API調用按Tokens、調用次數或時間區間計費;C端產品常見訂閱制,大模型應用如智能助手類App也常見廣告盈利;與第三方開發者通常通過平臺生態模式收費及分成。未來,MaaS定制化服務預計成為主流,推動行業向頭部廠商收斂。
(1)大模型應用落地情況現狀
目前,各行業在大模型技術的應用上主要集中在兩個階段:探索孵化期與試驗加速期。部分行業已經步入采納成長期,尚未有行業達到落地成熟期。
圖12:主要行業的大模型應用階段情況示意圖
來源:騰訊研究院
截至2023年,金融、政府、影視游戲和教育領域是大模型滲透率最高的四大行業,滲透率均超過50%。電信、電子商務和建筑領域的應用成熟度較高。
圖13:大模型滲透率和應用成熟度示意圖
來源:融中咨詢
應用場景呈現“微笑曲線”特征,產業鏈高附加值的研發設計與營銷服務環節進展最快。而在低附加價值的中部(生產、組裝等),大模型應用進程較慢。
圖14:大模型應用場景“微笑曲線”
來源:騰訊研究院
表2:大模型應用場景代表
來源:融中咨詢
(1)全球競爭格局
從全球范圍來看,美國、中國及歐洲在大模型領域引領全球發展。在2024年的重要大模型(Notable Models)評估中,美國以40個模型的入選數量領先,而中國則以15個位列第二,歐洲以3個模型排名第三。在業內頂級專家評選出的32項“2024年AI領域重要發布”中,中國的阿里Qwen2、Qwen2.5及DeepSeek-V3發布上榜[3]。
圖15:全球重要大模型分布
來源:Epoch AI
此外,斯坦福大學發布的《2025年人工智能指數報告》報告顯示,中國大模型性能提升顯著,由2023年的17.5%大幅縮至0.3%,中美雙方的模型性能差距逐漸縮小。2024年1月,美國最佳模型的表現較中國頂尖模型領先9.26%;到2025年2月,這一差距已縮小至1.70%。在推理、數學和編程等其他基準測試中,也可觀察到類似趨勢。
圖16:中美大模型對比(LMSYS)
來源:LMSYS
從海外大模型格局來看,OpenAI、Anthropic、谷歌三大廠商領頭閉源大模型,Meta開源追趕的格局。OpenAI憑借2023年先發的GPT-4,基本穩定在行業龍頭地位,而Anthropic憑借Claude、谷歌憑借Gemini后發。可以看到,2024年以來,三家大模型能力呈現互相追趕態勢。
表3:OpenAl 、Google 、Anthropic 主要模型對比
來源:各公司官網、華泰研究
OpenAI:于2025年4月最新發布的o3和o4-mini模型是OpenAI首批具備“圖像思考”能力的模型。與谷歌Gemini2.5 Pro和Anthropic Claude 3.7 Sonnet相比,o3和o4-mini的圖像分析能力更接近人類水平,能處理模糊、低質量圖像,并在推理中動態調整畫面。
Anthropic:于2025年5月發布最新大模型ClaudeOpus4和ClaudeSonnet4。據日本Rakuten測試數據顯示,基于Opus4打造的編程智能體,可獨立穩定連續工作7小時,超越此前OpenAI的紀錄;Sonnet4在編程領域的SWE-bench測試中得分達到72.7%,超過了OpenAI最新發布的Codex-1、o3等前沿模型[4]。
谷歌:于2025年5月推出最新模型Gemini2.5Pro,其特點在于,不僅整體領先,且表現均衡,沒有明顯弱項。在幾乎所有的評測維度上都穩居第一,尤其是在理解并執行帶風格要求的復雜指令及維持多輪對話連貫性方面優勢顯著。
圖17:Gemini2.5Pro登頂LMSYS Arena榜單
來源:LMSYS Arena
開源模型中,Meta在格局上具有特殊的分界性。
Meta于2025年4月推出最新模型Llama4,海外模型廠商如果在性能上無法超越同代的開源Llama,就很難在海外基礎模型中占據一席之地。反之,如果能夠超過同代的Llama或者有獨特使用體驗,則易得到用戶青睞,例如具有差異化應用場景的陪伴類應用Character.ai、擁有獨家平臺數據庫的xAI的Grok-1、Grok-1.5。
圖18:Meta在海外大模型市場格局的特殊性
來源:各公司官網、華泰研究
(2)中國競爭格局
目前國內大模型仍處研發和迭代的快速發展階段,互聯網巨頭、初創公司、科技企業均有代表性模型產品,形成“巨頭引領、初創突圍”的雙軌格局。
互聯網巨頭以阿里巴巴、騰訊、字節跳動等為代表,依托固有業務更早形成壁壘;創業梯隊形成“6+2”格局,包括“創業六小強”——智譜AI、MiniMax、階躍星辰、百川智能、月之暗面和零一萬物,以及面壁智能和DeepSeek兩家新起之秀。
核心功能上,處理文本功能相對突出的有阿里通義千問、智譜AI、百度文心一言、月之暗面Kimi 、百川智能等;具備多模態相對優勢的有Minimax、豆包、階躍星辰、騰訊混元、紫東太初等;在邏輯推理功能比較突出的有DeepSeek、科大訊飛星火大模型、昆侖萬維、華為等。
策略上,阿里巴巴通義千問、DeepSeek、昆侖萬維、中科院紫東太初等主要布局開源策略,通過開源建立開發者社區,實現快速生態擴張;華為、字節跳動豆包、月之暗面Kimi等主要布局閉源策略,確保技術壟斷、數據安全及商業化可控;騰訊混元、智譜AI、科大訊飛星火大模型、面壁智能、階躍星辰、百川智能、Minimax、零一萬物等則選擇混合策略,平衡開源引流與閉源變現。
區域分布中,北京絕對領先,聚集智譜AI、百川智能、字節跳動等大模型數量占全國40%;廣東憑借華為盤古、騰訊混元等32個人工智能大模型形成生態矩陣,側重金融、制造等場景應用落地,截至24年3月,綜合算力指數全國第一;浙江(阿里)、上海(階躍星辰)緊隨其后。其他省份如安徽(科大訊飛)、四川(華為云)、江蘇(云從科技)等主要依托單一龍頭企業布局。
圖19:我國AI大模型產業重點企業分布圖
來源:融中咨詢
(1)互聯網科技巨頭
1)百度:文心大模型
百度自2010年起就布局人工智能,現已實現全棧AI閉環,覆蓋芯片層(昆侖芯片)、框架層(飛槳深度學習平臺)、模型層(文心大模型系列)、應用層,且在各層都有相對領先的關鍵自研技術。
“文心”大模型包含NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型等,分別可用于語言、圖像、跨模態、生物、細分行業等。其中,“文心一言”是基于文心NLP大模型的對話式產品,能夠與人對話互動、回答問題、協助創作,其核心優勢是對中文的理解。截至2024年底,“文心一言”用戶規模達到4.3億。百度于2025年3月發布“文心”大模型4.5和X1,4.5是原生多模態大模型,多模態理解和生成能力強,測試成績優于GPT4.5,API調用價格僅為其1%。X1是深度思考模型,增加多模態和多工具調用,性能對標DeepSeek-R1,調用價格為其一半。
圖20:文心全景圖
來源:文心大模型官網
2) 阿里:通義大模型
阿里是全球少有實現“全尺寸、全模態”開源的云計算廠商。截至25年5月,已開源200+模型,衍生模型超10萬,下載量突破2億次,Hugging Face社區占比超30%。但是非阿里云用戶需額外采購云資源,削弱了其開放性。
通過“通義”大模型,阿里構建了層次化的模型體系,其中通用模型層覆蓋自然語言處理(通義千問)、多模態等,專業模型層則深入醫療、法律、金融、娛樂等行業。2025年4月,阿里發布的Qwen3是國內首個混合推理模型,其參數量僅為DeepSeek-R1的1/3,但成本大幅下降,性能全面比肩R1、OpenAI-o1等全球頂尖模型。
圖21:阿里通義大模型架構
來源:阿里巴巴
3) 騰訊:混元大模型
騰訊的“混元”大模型涵蓋計算機視覺、自然語言處理、多模態內容理解、文案生成、文生視頻等方向。
“混元”大模型在社交、娛樂等垂直領域具有獨特優勢。依托微信、QQ、等超級App積累的社交關系鏈、用戶畫像及內容交互數據,“混元”大模型在個性化推薦、情感交互、UGC內容生成方面的能力具備一定不可替代性。此外,“混元”大模型依托騰訊游戲、騰訊影業、閱文集團,實現了在游戲與泛娛樂場景的垂直突破。
2025年2月,騰訊最新發布的“混元TurboS”是業界首款大規模混合Mamba-MoE模型,在Chatbot Arena上國內僅次于DeepSeek。基于TurboS基座,騰訊隨之推出視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice。T1-Vision實現“邊看圖邊思考,Voice實現低延遲語音通話,擬人性和情緒應用能力也有明顯提升。
圖22:騰訊混元TurboS位列Chatbot Arena 榜單第八
來源:Chatbot Arena
4)華為:盤古大模型
華為構建了強大的AI技術生態系統,包括“鯤鵬+昇騰”算力資源、Mind Spore AI框架、Model Arts開發平臺和盤古大模型四層架構。其中,華為“盤古”大模型由計算機視覺大模型、科學計算大模型、自然語言處理(NLP)大模型、多模態大模型組成。2025年4月,華為最新發布的Pangu Ultra是基于昇騰算力的千億級通用語言大模型,證明了基于全國產也可以實現領先的大規模語言模型的研究與開發。
“盤古”大模型更強調行業應用,而非泛化場景,通過“5+N+X”分層架構,聯合打造行業解決方案。例如,盤古CV大模型目前覆蓋了工業質檢、物流倉庫監控、時尚輔助設計等領域;盤古NLP大模型覆蓋了智能文檔檢索、智能ERP和小語種大模型;盤古科學計算大模型則應用于氣象預報、海浪預測等方面。
表4:盤古系列模型應用場景和領域
來源:華為,國信證券經濟研究院
5)字節:豆包大模型
字節的“豆包”大模型家族涵蓋9個模型,主要包括通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等,側重于在語言大模型和圖像大模型兩方面布局。字節最新推出的Doubao-1.5-realtime-voice-pro實現會哭會笑、能說方言會唱歌的多模態能力的全面提升。
“豆包”大模型在多模型功能、短視頻領域具有顯著優勢,但“豆包”在長文本與邏輯推理上相對較弱。依托抖音、TikTok、今日頭條等超級App,“豆包”大模型在短視頻理解、實時熱點捕捉、多模態內容生成上具備數據壁壘;通過用戶點擊、停留、互動數據,“豆包”模型能精準預測內容傳播趨勢對短視頻幀級語義分析。并且依托TikTok的全球流量,將有助于“豆包”加速海外市場布局。
6) 科大訊飛:星火系列大模型
科大訊飛的“星火”系列大模型是國內首個完全基于國產算力訓練的大模型,初代發布于2023年5月,至今已迭代至星火V4.0。2025年4月,科大訊飛最新推出首個基于全國產算力訓練的深度推理大模型“訊飛星火X1”,在模型參數比同類模型小一個量級的情況下,整體效果對標OpenAIo1和DeepSeekR1;同時,支持SFT、強化學習兩種模型定制優化方案,定制門檻低。
“星火”大模型深耕教育和醫療方向,同時通過行業定制化解決方案賦能汽車、辦公等多個垂直領域。依托訊飛智慧教學平臺,其AI學習機覆蓋全國2000余所學校,智能批閱機和教師助手提升教學效率,偏遠地區1000多所學校受益于AI教育公益項目;依托訊飛醫療,智醫助理在6萬家基層醫療機構應用,提供超8.77億次輔診建議,修正150萬例診斷。
(2)典型大模型創業企業
1) 深度求索:DeepSeek系列大模型
2025年1月,深度求索“DeepSeek-R1”的發布引燃生成式AI行業熱情。作為開源模型,DeepSeek創新探索“算法優化替代算力堆砌”的路徑,它的成本大幅低于其他模型,同時性能與OpenAI等先進閉源大模型接近。截至2025年3月末,已有超100家金融機構完成DeepSeek本地接入或部署,涵蓋銀行、證券、保險等主要金融業態。
DeepSeek通過開源帶來的模型平權推動相關企業加速適配DeepSeek。2025年2月以來,已有超20家云服務和智算企業宣布支持DeepSeek,包括華為云、騰訊云、阿里云、百度智能云、火山引擎、京東云、三大運營商云等。同時,海外科技巨頭微軟、英偉達、英特爾、亞馬遜等也已上線DeepSeek。
(2) 智譜AI:GLM系列模型
智譜AI成立于2019年,其研發的GLM系列模型創新性地結合了GPT和BERT的架構優勢。2021年3月,智譜成為國內首個完成千億參數模型訓練的公司,比百度ERNIE 3.0早4個月。2025年3月,智譜AI推出將深度思考與自主行動結合的“AutoGLM沉思”模型,其特點在于,“AutoGLM沉思”不僅能深入研究、提供分析,還能主動執行任務,推動AIAgent從單純的思考者進化為能夠交付結果的智能執行者。
智譜團隊兼具商業化運營能力,開創了“模型即服務(MaaS)+智能體生態”的雙輪模式。“AutoGLM沉思”智能體上線三個月,已為2萬家中小企業自動生成上市招股書、盡調報告等專業文檔,客單價達3萬元/年。而開源的ChatGLM系列,則通過開發者生態衍生出超過200個垂直行業插件,形成獨特的"開源獲客,閉源變現"路徑。不過,智譜AI在多模態生成及C端市場開拓稍顯不足:視頻生成功能“清影”初步研發,與Sora、Pika等國際模型存在差距;C端業務目前以免費為主,主力應用“智譜清言”,與國內主流大模型日活躍量相比差距較大。
圖23:AutoGLM沉思背后的GLM模型架構
來源:CSDN社區
(3)月之暗面:Kimi
月之暗面(Moonshot AI)成立于2023年3月,核心產品是23年10月推出的智能助手產品Kimi。Kimi專注于長文本處理,支持200萬漢字的無損上下文輸入,遠超當時Claude-100k(實測約8萬字)和GPT-4-32k(實測約2.5萬字)。截至2024年末,Kimi全平臺月活躍用戶達2,101萬,全年復合增長率69.4%23。不過,Kimi面臨巨頭生態擠壓困境。通義千問、360AI瀏覽器先后宣布將支持1000萬、500萬字的長文本功能,文心一言將開放長文本能力,文字范圍會在200萬至500萬字。
自2024年12月起,Kimi連續發布一系列模型并開源Kimi-VL視覺語言模型及Kimina-Prover技術報告。其中,k1.5short-CoT在數學、代碼、視覺多模態和通用能力,大幅超越了GPT-4o和Claude 3.5 Sonnet。
圖24:k1.5 short-CoT在數學、代碼、視覺多模態和通用能力的表現
來源:AIME,MATH500,Codeforces,LiveCodeBench,MathVista,MMMU等各榜單
(4) 百川智能:Baichuan大模型
百川智能是由前搜狗CEO王小川于2023年4月創立,成立后相繼發布了Baichuan-7B、Baichuan-13B等開源模型及Baichuan-53B、Baichuan2-192K等閉源模型。2024年5月,百川智能發布最新一代基座大模型Baichuan4,較上一代模型通用能力提升超過10%,數學和代碼能力分別提升14%和9%。
百川智能是國內少有的專注醫療的頭部大模型公司,其構建了超千億Token的醫療數據集,通用醫療增強大模型不僅在USMLE測試中超越了GPT-4,并且在協和、北醫等頭部醫療機構進行的人工測評中超越了GPT-4。2024年8月,百川智能與北京兒童醫院簽署戰略合作協議,共同推出五款AI醫療產品。
圖25:Baichuan4在SuperCLUE2024年4月榜單國內第一
來源:SuperCLUE
(5) 昆侖萬維:天工大模型
昆侖萬維在2020年便已開始布局AIGC領域,形成了AI大模型、AI搜索、AI游戲、AI音樂、AI動漫、AI社交六大AI業務矩陣。以AI音樂平臺Mureka、AI短劇產品SkyReels、AI社交產品Linky為代表,昆侖萬維在不斷拓展差異化AIGC娛樂場景邊界。
昆侖萬維的“天工”大模型在國際化及娛樂垂直領域具有較強優勢。昆侖萬維2024年海外業務營收16.7億元,占總收入比重達94.9%。2025年5月,昆侖萬維正式推出全球首款基于AI Agent架構的Office智能體手機應用“天工超級智能體”。該模型具有較強的自主決策能力,例如當用戶輸入“撰寫行業報告”時,系統能自動調用權威數據庫進行交叉驗證,生成完整框架,并同步生成PPT與Excel。
圖26:昆侖萬維在GAIA評測登頂全球榜首
來源:GAIA
(6)MiniMax:abab系列大模型
MiniMax成立于2021年11月,相較于同業往往以某一模態為主,MiniMax較早布局多模態領域,目前已推出視頻大模型、音樂大模型及語音大模型,圍繞產品需求打造全矩陣多模態模型。abab-video-1支持1280×720 分辨率、25fps的高清視頻生成,具備電影感鏡頭移動效果,在物理正確性、動態穩定性和風格多樣性上達到實用水準。abab-speech-1情緒表達細膩自然,與視頻生成模型結合可實現多語言視頻配音。
2024年,MiniMax發布萬億參數MoE架構模型。2025年1月,MiniMax發布并開源新一代01全新系列模型,首次大規模實現線性注意力機制,替代了傳統Transformer架構。
圖27:MoE與Dense架構對比
來源:MiniMax
(7)階躍星辰:Step系列大模型
階躍星辰成立于2023年4月,其Step系列模型矩陣,包括Step-1千億參數語言大模型、Step-1V千億參數多模態大模型以及Step-2萬億參數MoE語言大模型。Step系列在2025年最新發布的模型涵蓋視頻生成、推理、音樂、3D建模等多個領域。
與MiniMax側重C端消費者場景不同,階躍星辰主要提供B端企業級服務,向汽車、金融、智能終端等行業滲透。2024年,階躍星辰聯合國泰君安、界面財聯社推出業內首個千億級參數多模態證券垂直類大模型君弘靈犀大模型,同年與OPPO、TCL合作,將多模態能力嵌入手機、IoT設備。
(8) 面壁智能:MiniCPM系列模型
面壁智能成立于2022年8月,在端側小模型領域表現突出,其MiniCPM系列模型輕量化與高性能并存。最新模型MiniCPM 3.0量化后可在端側設備上運行,并實現GPT-3.5級性能,而參數僅為其1/43;
面壁智能堅持開源戰略,其模型在GitHub、HuggingFace等平臺廣受認可,下載量超400萬,位列2024年最受歡迎中國企業榜首。面壁智能業務覆蓋汽車、智能家居、教育等多個領域,推出AgentVerse、ChatDev等智能體平臺。端側商業化方面,發布全球首個落地車端的純端側智能助手“小鋼炮超級助手cpmGO”; 2025年4月,面壁智能與長安馬自達合作,實現少有的搭載端側模型的量產車型落地。
圖28:MiniCPM-o2.6多模態能力在各項評測榜單評分
來源:MiniMax
(9)中科院自動化所:紫東太初大模型
“紫東太初”大模型是全球首個支持圖文音三模態的大模型。2024年底最新發布的紫東太初3.0,首次從模態獨立編碼轉向多模態統一原生編碼,實現“以圖生音”等復雜交互,此外,“紫東太初”引入混合專家模型架構,更接近于人類的理解推理和思考能力。
“紫東太初”核心應用集中于政策驅動型場景,政府背書和產學研優勢顯著。其研發過程得到科技部、工信部等機構的數十項國家重大項目支持,被列為中科院“十四五”規劃重點項目。這種定位使其在政策傾斜、行業標準制定、政企協同合作等方面具有天然優勢。并且依托國家重點實驗室等科研平臺,牽頭成立多模態人工智能產業聯合體,成員單位已達100余家,涵蓋高校、企業、科研機構,形成全鏈條合作生態。但這些項目雖能體現技術價值,市場化拓展能力不足。
(1)大模型的幻覺
幻覺是指模型生成看似合理但實際上錯誤或虛假的內容,沒有真實依據或與事實相悖,表現形式主要有:編造不存在的人物、事件或數據,張冠李戴、邏輯錯誤、自相矛盾,“一本正經地胡說八道”等。
幻覺率(Hallucination Rate)是衡量模型生成錯誤或虛構信息的頻率的指標。根據Vectara發布的幻覺評估測試,ChatGPT-4的幻覺率約1-3%,DeepSeek的幻覺率約2-15%,大部分中文大模型的幻覺率在10-30%。
圖29:幻覺率最低的25個大模型
來源:Vectara'sHHEM,更新日期2025年4月29日
(2)算法偏見
算法偏見是大模型在數據驅動學習過程中不可忽視的問題,表現為對性別、種族、文化等的系統性不公,即在處理和生成內容時,有時會系統性偏向某些群體、觀點或結果。
算法偏見的主要危害有:加劇社會不平等(如GPT-3生成“女性適合行政崗位”)、侵犯個人權益、引發倫理與法律風險、威脅公共安全與信任、企業聲譽與經濟損失(如谷歌Gemini因無法正確生成白人歷史圖像引發公眾質疑)等。算法偏見通過數據、算法和應用的連鎖反應,放大社會既有不平等,威脅個人權益、企業合規與社會穩定,進而造成公眾對AI系統信任的下降。
(3)長上下文限制
大模型在處理超長文本時的能力有限,特別是在輸入長度接近或超過其“上下文窗口”限制時,模型要么截斷前文,要么壓縮摘要,導致無法再準確記憶、理解或推理大量上下文信息。當前主流模型輸入長度普遍在64K–128K,如DeepSeek-V3上下文長度約為64K tokens(約5萬字)、GPT-4 Turbo約為128K tokens(約 10 萬字),而輸出長度多數限制在8K–16K。
與推理效率不同,后者已有蒸餾、剪枝、LoRA等工程化方案可緩解,而長上下文處理尚缺乏標準架構和端到端能力方案,已成為新一代基礎模型架構創新的關鍵瓶頸。它也是阻礙B端大模型落地的第一技術難題。文檔問答、代碼生成、法律咨詢、多輪對話、企業知識庫等B端關鍵場景高度依賴長上下文理解能力,而“上下文窗口”限制了大模型在這些高價值應用場景的落地。
(4)Scaling Law撞墻
OpenAI的GPT-3至GPT-4展示了顯著的性能提升,但據報道,其下一代模型“Orion”的性能提升幅度有限,尤其在編程等任務上未明顯超越前代模型。這表明,盡管投入了更多的計算資源和數據,模型性能的提升已趨于平緩,傳統的 Scaling Law 效應開始減弱。
所謂“撞墻”,即指在進一步擴大模型規模(例如從千億參數擴展到萬億參數)后,性能提升逐漸放緩甚至停滯,投入的算力與成本無法換來預期的性能收益,主要表現為:邊際效應遞減、基礎路徑不再有效、技術不確定性提升以及資源與資金浪費。
Scaling Law 撞墻是大模型行業正面臨的一種“范式級挑戰”,它意味著依賴無限放大模型規模的路線走到了瓶頸,企業必須在效率、結構創新和多模態協同等方面尋找新突破口。
(5)數據版權
大模型訓練高度依賴海量的高質量文本、圖像、音頻等多模態數據,而這類數據往往來源于互聯網、數據庫或商業內容平臺,很多都帶有明確或隱含的版權約束。未經授權使用這些內容進行訓練,可能侵犯原作者或平臺的知識產權,引發法律訴訟和經濟賠償風險。
近年來,全球范圍內已有多起AI企業被新聞機構、作家聯盟、圖片平臺(如Getty Images)等起訴,凸顯了這一問題的嚴重性和現實性。
數據版權問題還帶來倫理和行業生態方面的挑戰。如果大型企業依靠“掠奪式”數據采集建立模型優勢,不僅損害內容創作者權益,還可能擠壓中小內容平臺的生存空間,扭曲數據獲取市場的公平性。這要求AI行業在數據使用上建立合規透明的機制,例如加強數據來源披露、推動開放授權數據集建設、制定行業自律規范等,以在技術發展與版權保護之間尋找平衡。
(6)有害輸出
大模型可能在生成過程中輸出帶有歧視、仇恨、暴力、色情、恐怖主義、欺詐等內容,這些有害輸出不僅違反法律法規,也可能對用戶心理、安全乃至社會輿論造成嚴重影響。
2024年2月,美國佛羅里達州14歲男孩在與AI聊天機器人互動后不久自殺身亡。幾個月來,他一直在一款人工智能應用程序上與一個栩栩如生的《權力的游戲》聊天機器人聊天,而該聊天機器人卻向他發送了一條令人毛骨悚然的信息,讓他“回家”吧。男孩隨后自殺身亡。
監管機構和公眾對生成式AI輸出的可信度和道德底線越來越關注,一旦模型被證實頻繁輸出有害信息,不僅會影響用戶信任,還可能觸發行業性的政策收緊與限制。
[1]浙商證券研究所《科大訊飛深度報告:訊飛星火點亮千行百業》
[2]慧博智能投研《AI大模型行業深度:行業現狀、應用情況、產業鏈及相關公司深度梳理》
[3]斯坦福大學《2025年人工智能指數報告》
[4]https://mp.weixin.qq.com/s/THZiAlQ8UMvoc9ywJslPYQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.