作者 林易,編輯重點君
如果你也感覺AI圈的時間流速快得讓人窒息,那么恭喜你,我們都有同感。
短短四個月,AI領域風起云涌,技術迭代的速度堪比坐上了火箭。從底層算力,到基礎大模型,再到遍地開花的AI應用,AI幾乎以天為單位在進化。幾個月前,沒人會想到,來自中國DeepSeek們煽動的翅膀,會產生如此劇烈的蝴蝶效應。可以肯定的是,大浪淘沙,真正的好戲才剛剛開始。
這也是《劃重點》開始制作「大模型月報」的原因。以后我們會每月為您梳理那些不容錯過的AI趨勢,從中找到通向未來的答案。
這次,我們復盤了過去四個月AI算力、模型和應用等方面的進展,關注到5個關鍵變化。如果有任何遺漏,歡迎您在評論區留言。以下是「大模型月報」首期:
變化一:基礎模型淘汰賽打響,開源模型繼續狂飆,推理能力跨越式進化
過去兩年,百模大戰的盛況還歷歷在目,但進入2025年,一個殘酷的現實擺在面前:基礎大模型的“淘汰賽”已經悄然打響。
海外,OpenAIGPT系列在年初再次提升了邏輯推理和復雜任務處理能力,尤其是在數學、編程和科學文獻理解方面。GoogleGemini系列、AnthropicClaude 3家族(特別是Opus版本)也緊隨其后,不斷優化模型性能和安全性。
國內,DeepSeek還沒發布的新版大模型R2,仍是期待值最高的存在;2024年因戰略失誤落后的玩家百度,憑借文心4.5及文心X1系列,又重新坐回了牌桌。目前基本是“1+4+N”的格局:1是DeepSeek;4是阿里、百度、字節和騰訊;至于N,玩家還未穩定。
然而,聚光燈之外,許多缺乏核心技術、清晰商業模式或強大資金支持的中小模型項目,在過去四個月里逐漸聲量減弱,甚至黯然離場。市場開始意識到,通用大模型的門票,不是誰都能輕易拿到。
開源模型繼續狂飆。Meta的Llama系列在第一季度如期更新,繼續扮演著開源生態的“壓艙石”,為全球開發者提供了強有力的基座模型。Mistral AI、Cohere等明星開源力量也持續貢獻高質量模型。
中國開源力量中,阿里Qwen3系列全量開源,阿里也憑借較早確立的開源路線,在模型大戰中后來居上;而DeepSeek最新模型Prover-V2-671B以88.9%的數學定理證明通過率,進一步驗證了“小預算撬動高性能”的可能性。
但值得注意的是,單純追求“開源”名號而缺乏維護和迭代的低質量項目,正被社區快速拋棄。開源社區開始更加注重模型的實用性、效率和可信賴度,而非僅僅是又一個新模型。
推理能力跨越式進化。如果說過去的模型在“知識廣度”上做文章,那么今年初的趨勢是,頭部模型在“推理深度”上取得了顯著突破。無論是通過更優化的訓練方法(如強化學習從人類反饋RLHF的進階版)、更精巧的模型架構(如混合專家MoE的成熟應用),還是對“思維鏈”(Chain-of-Thought)乃至更復雜的“思維樹”(Tree-of-Thoughts)等推理策略的深度融合,使得頂尖模型在面對多步驟、需要復雜邏輯判斷的任務時,表現得更像一個“會思考”的伙伴,而非簡單的“復讀機”。
大模型領域正從“人人都能參與”的普惠階段,進入到“強者恒強,優勝劣汰”的整合階段。對于大模型玩家而言,要么擁有絕對領先的技術和資金,要么在特定領域或特定能力上做到極致,否則生存空間將急劇壓縮。開源模型的重要性愈發凸顯,但其發展也更趨理性。
變化二:AI從內卷參數轉向建立生態,MCP、A2A掀起“技術平權運動”
曾幾何時,千億、萬億參數是衡量大模型實力的重要指標。但進入2025年,業界風向大變:單純的參數內卷正在被建立生態取代。
過去四個月,最受關注的是MCP、A2A協議,MCP即模型協作協議(Model Collaboration Protocol)、A2A即智能體間協議(Agent-to-Agent Protocol)。這兩個略顯生僻但可能極具顛覆性的概念,開始在技術社區和行業會議中被頻繁提及。
MCP技術源自Anthropic,旨在讓不同來源、不同架構、不同特長的AI模型能夠像樂高積木一樣,通過標準化的接口和協議高效協同工作,就像一個USB接口或者說萬能插座。比如,一個擅長文本理解的模型,可以無縫調用另一個擅長圖像生成的模型,共同完成一個復雜的圖文創作任務。
A2A則更進一步,致力于為不同AI智能體(Agent)之間的自主交互和協作制定規則。未來,你的個人AI助手或許能直接與航空公司的AI客服自主協商,完成改簽任務,無需人工介入。 這些協議的早期草案和開源實現,在年初的一些開發者大會上(如FOSDEM或特定的AI工作坊)引發了熱烈討論。
MCP和A2A的出現,不僅僅是技術上的創新,更可能引發一場“技術平權運動”。當中小型開發者或企業無力從零開始構建一個全能的巨型模型時,他們可以通過這些開放協議,調用和組合生態中已有的、更專注、更經濟的多個模型或智能體服務,形成強大的復合能力。這無疑將極大降低AI應用的門檻,催生更多創新。
這種趨勢意味著AI行業的關注點,正從“我擁有多強的模型”轉向“我能用AI解決什么復雜任務”。生態的價值在于,通過協作和組合,實現單個模型難以企及的復雜目標。總結一下,就是從模型為中心到任務為中心。
AI的未來不再僅僅是少數巨頭的獨角戲。通過開放標準和協議構建的協作生態,有望讓更多參與者共享AI發展的紅利。就像移動互聯網時代,iOS、安卓生態的建立,讓APP開發者都有公平的機會從中受益。
變化三:底層算力軍備競賽白熱化,國產算力加速突圍,全球投資降溫
AI的發動機算力芯片,戰略地位在過去四個月有增無減。
NVIDIA王者依舊,而AMD/Intel等老對手也緊追不舍。黃仁勛的NVIDIA在GTC 2025上再次“秀肌肉”,Blackwell架構的B100/B200 GPU開始規模化出貨,性能參數繼續領跑。同時,對下一代架構的展望也吊足了市場胃口。AMD憑借其MI300系列的迭代產品,在特定AI負載上持續攻城略地。Intel的Gaudi 3也憑借其性價比和開放性,在一些云服務商和企業客戶中找到了增長點。
當然,兩者都對老黃構不成威脅,H20被禁運中國才更讓他頭疼,畢竟中國市場占英偉達全球營收近20%。
面對日益復雜的國際環境和對供應鏈安全的考量,國產AI算力突圍在過去四個月也明顯提速。華為昇騰系列在支撐國內大模型訓練和推理方面扮演了更核心的角色,生態適配和工具鏈建設取得積極進展。其他本土AI芯片公司,如壁仞科技、摩爾線程、燧原科技等,也在特定應用場景中持續投入,努力提升產品性能和市場認可度。
一個值得注意的現象是,相比中國GPU市場的供不應求,受業務周期影響,全球算力投資又放緩了一些。市場調研機構Semianalysis 稱,過去兩個季度,微軟放棄遠超 2GW 功耗的數據中心租賃合同,近期又凍結 1.5GW 自建數據中心項目。這些項目原計劃在2025 年和 2026 年投入使用。作為對比,馬斯克旗下 xAI 建設的大型數據中心,剛開始功耗大約 0.5 GW。亞馬遜等大廠也在暫緩租賃更多數據中心。英偉達的股價持續波動,今年以來已下降近20%。
此外,全球范圍內針對AI硬件初創企業的風險投資,在2025年第一季度似乎出現了一絲“降溫”跡象。經歷了前幾年的狂熱追捧后,投資者變得更加謹慎,更看重初創企業的技術壁壘、商業化能力和短期盈利前景。這或許意味著,AI硬件領域的資本門檻正在提高,市場集中度可能進一步加劇。
算力依然是AI發展的核心瓶頸與競爭焦點。國際巨頭的技術迭代和生態壁壘短期難以逾越,但國產算力的自主化進程,也在國家戰略和市場需求的雙重驅動下全力沖刺。投資風向的微妙變化,則預示著AI產業正從「講故事階段」過渡到「見實效階段」。
變化四:AI應用從炫耀技術到解決問題,垂直領域落地加速滲透
如果說2024年是AI應用的“體驗年”,那么2025年則是AI應用的“實用年”。
過去四個月,市場對AI應用的評判標準發生了顯著變化,AI應用從炫耀技術轉向解決問題。單純的“酷炫”功能已不足以打動用戶和企業,能否切實解決行業痛點、提高生產效率、降低運營成本,成為衡量AI應用價值的“金標準”。
AI在垂直領域滲透多點開花。比如:
醫療健康:AI輔助影像診斷系統在更多醫院試點,AI驅動的新藥研發流程進一步縮短,個性化健康管理方案開始出現。
金融科技:更智能的量化交易模型、更精準的風險評估與反欺詐系統、更具個性化的智能投顧服務加速落地。
工業制造:基于機器視覺的AI質檢、設備的預測性維護、智能排產與供應鏈優化,在智慧工廠中得到更廣泛應用。
教育科研:AI個性化輔導系統、科研文獻智能分析與綜述工具、實驗數據智能處理等,正在改變教與學、研與創的方式。
內容創作與營銷:AI生成內容(AIGC)工具從單一的圖文生成,向更復雜的視頻、3D模型、交互式內容創作拓展,并深度嵌入營銷自動化流程。
一批真正圍繞AI能力構建核心功能和用戶體驗的“AI原生應用”開始涌現,它們不再是傳統軟件的“AI+”補丁,而是從底層邏輯上就體現出AI驅動的特性。
現階段的AI應用,比拼的是對行業Know-How的理解深度和場景落地的執行力度。誰能率先在垂直領域打造出可規模化復制的成功案例,誰就能掌握下一階段的競爭主動權。
變化五:原生多模態與世界模型邁出關鍵一步,AI真正開始理解物理世界
毫無疑問,讓人工智能看懂、聽懂并理解我們這個復雜物理世界,是通往通用人工智能(AGI)的必經之路。過去四個月,AI在這一征途上邁出了關鍵一步。
此前的多模態模型更多是不同模態信息的“拼盤”,而最新的進展是,模型正在學習更深層次的跨模態關聯和因果推理。例如,模型不僅能根據文本生成連貫的視頻,還能在一定程度上理解視頻中物體的交互邏輯和物理屬性的合理性。一些研究開始探索讓模型同時處理文本、圖像、音頻、視頻乃至觸覺、運動等更廣泛的模態數據。
同時,「世界模型」研究也取得突破性進展。Yann LeCun等AI巨擘力倡的「世界模型」(World Models),即讓AI學習并內化物理世界的運行規律。在過去這段時間不再僅僅是理論探討,一些頂尖實驗室(如DeepMind、FAIR及部分高校)展示了其原型系統在模擬簡單物理環境、預測物體運動軌跡、甚至理解基本因果關系方面的初步但令人鼓舞的能力。這些模型通過觀察海量視頻數據或在虛擬環境中進行交互學習,開始構建對現實世界的“直覺”。
此外,具身智能(Embodied AI)迎來新進展。大模型的進步,為機器人技術和自動駕駛等具身智能領域帶來了新的曙光。當AI大腦能夠更好地理解物理規則和環境動態,機器人才有希望在復雜、非結構化的真實環境中更自主、更智能地執行任務。我們看到,一些結合了大語言模型和世界模型的新型機器人控制架構開始出現。對于國內讀者來說,宇樹機器人、機器人馬拉松,這些熱點新聞,讓我們對理解這個領域有天然優勢。
總之,AI正從對符號世界的“統計學理解”逐步邁向對物理世界的“認知理解”。雖充滿挑戰,但意義深遠。一旦AI真正開始理解物理世界的運作方式,其賦能范圍和深度將發生質的飛躍,催生出今天難以想象的新應用和新產業。
結語:AI的終極價值是回歸“人的尺度”
盤點至此,AI技術浪潮的洶涌澎湃已無需贅言。但越是在技術高歌猛進之時,我們越需要冷靜思考一個根本問題:AI的終極價值是什么?
答案或許很簡單:回歸“人的尺度”,真正為個體、為社會創造可感知的價值。AI并不會自動改變世界,只有當它被有效地應用到具體場景中,被人真正用起來,融入到日常工作與生活,它的革命性力量才能釋放。
下個月,我們或許將見證更驚人的突破,畢竟在AI世界,唯一不變的就是永遠在變,而且是光速變化。
重點君也會一直關注AI,記錄我們所處的這場偉大的技術浪潮。如果你對內容感興趣,可隨時和我們交流。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.