機(jī)器之心原創(chuàng)
編輯:吳昕
不要抗拒趨勢
在微軟 Build、谷歌 I/O、 Code with Claude 三大開發(fā)者大會(huì)接連登場的一周里,微軟為 Windows 加裝模型上下文協(xié)議(MCP),Google Gemini 野心初顯「AI 操作系統(tǒng)」,Claude 4.0 高調(diào)搶灘編程主戰(zhàn)場。
就在這樣的節(jié)奏下,5 月 27 日,螞蟻集團(tuán)的開源團(tuán)隊(duì)「接棒」發(fā)布了一張《 2025 大模型開源開發(fā)生態(tài)全景圖》。
訪問地址:
https://antoss-landscape.my.canva.site
完整項(xiàng)目列表和相關(guān)數(shù)據(jù):
https://docs.google.com/spreadsheets/d/1av9kitgnRGtsmDp6AbW96m2cCR4jXZFQmUVG2di8Bjw/edit?gid=0#gid=0
這是一張由開源社區(qū)數(shù)據(jù)驅(qū)動(dòng)的技術(shù)演進(jìn)路線圖——
135 個(gè)社區(qū)核心項(xiàng)目、19 個(gè)技術(shù)領(lǐng)域,全面覆蓋從智能體應(yīng)用到模型基建,系統(tǒng)性梳理了開源力量在大模型浪潮下的集結(jié)與演化路徑。
其中,模型訓(xùn)練框架、高效推理引擎、低代碼應(yīng)用開發(fā)框架成為當(dāng)前最具主導(dǎo)力的三條技術(shù)賽道。
135個(gè)項(xiàng)目中位于2025 年 OpenRank 排名Top 20的項(xiàng)目。這里用到了華東師范大學(xué)X-lab實(shí)驗(yàn)室OpenRank影響力評價(jià)指標(biāo)。
結(jié)合前一張圖,將 OpenRank 指標(biāo)與 2024 年數(shù)據(jù)對比,三大主導(dǎo)技術(shù)賽道的同比上升幅度尤為明顯。
不要抗拒趨勢。」發(fā)布現(xiàn)場,螞蟻開源技術(shù)委員會(huì)副主席王旭談及全景圖的意義。
比起盲目對標(biāo),在一個(gè)飛速發(fā)展的領(lǐng)域,搞清楚哪些關(guān)鍵領(lǐng)域仍未涉足、哪些路線已經(jīng)成了技術(shù)冗余,對于企業(yè)而言更具現(xiàn)實(shí)意義。
對于開發(fā)者、投資人,尤其是打算「自己干」的人來說,也是一份值得參考的路線圖:哪些項(xiàng)目正拾級而上?哪些賽道開始日落西山?關(guān)鍵從來不是起點(diǎn)有多高,而是是否踩準(zhǔn)了那條上升通道。
一張快速變化領(lǐng)域的「撕拉片」
這張全景圖,像是一張為大模型開源生態(tài)拍下的「撕拉片」。在高速運(yùn)動(dòng)的行業(yè)面前,「咔嚓」定格了 135 個(gè)項(xiàng)目的最大「公約數(shù)」——
一場直播中的「現(xiàn)實(shí)世界的黑客松 (A Real-world Hackathon )」 。
與追求長線的傳統(tǒng)開源文化不同,這些項(xiàng)目大多靠熱點(diǎn)驅(qū)動(dòng),短期速成、技術(shù)聲譽(yù)兌現(xiàn)快;反之,隨著熱點(diǎn)不斷迭代,嚴(yán)重依賴熱點(diǎn)的項(xiàng)目「埋」得也快。
例如,對應(yīng)的閉源項(xiàng)目爆火后,Devika、OpenDevin、OpenManus 們在短周期內(nèi)密集登場并獲得極高關(guān)注度。
SGLang、vLLM 則代表另一種高頻脈動(dòng)的開發(fā)形態(tài)——方向明確,剩下的全靠「中美網(wǎng)友 24 小時(shí)輪肝」完成;幾乎每周都有新版本,生態(tài)在極高密度的「卷」中快速升級。
有些項(xiàng)目發(fā)展不錯(cuò),有些項(xiàng)目成功為背后工具鏈引流,還有的發(fā)展為商業(yè)項(xiàng)目,如 GPT Engineer 早期積累了?量?戶的明星開源項(xiàng)?,后續(xù)發(fā)展為閉源的商業(yè)化產(chǎn)品 Lovable。
一些項(xiàng)目爆發(fā)力極強(qiáng),一度擁有上萬 star 的關(guān)注度,但也面臨高淘汰率和低維護(hù)意愿的挑戰(zhàn),最后被「埋」。
除了 swarm 是 OpenAI 官?宣布不再維護(hù)外,其余項(xiàng)?的上?次代碼提交還停留在 2024 年,實(shí)質(zhì)性開發(fā)早已停滯。
如果就此止步,只看到爆款和淘汰,就難以理解為什么這些浪花會(huì)出現(xiàn)。推動(dòng)「黑客松現(xiàn)象」上演的還有更為深層的「地質(zhì)」動(dòng)力——
模型能力帶來的應(yīng)用重塑、生態(tài)位之間的動(dòng)態(tài)博弈。
以 AI 搜索為例,開源項(xiàng)目集體式微,并非「做得不夠好」,而是 GPT-4、Gemini 們已經(jīng)將聯(lián)網(wǎng)檢索、答案生成「內(nèi)嵌進(jìn)模型」,直接抹平了原有的工具價(jià)值。
AI Search 開源項(xiàng)目們的 OpenRank 趨勢,猶如日落西山
相反,AI Coding 類開源項(xiàng)目則一派繁榮,OpenRank 走勢「嘴角上揚(yáng)」幾乎成標(biāo)配。
這一輪熱潮的背后,是 Claude 3.7 Sonnet 等大模型在代碼生成與代碼理解能力上的集體飛躍,直接重構(gòu)了「人機(jī)協(xié)作」方式。
AI Coding開源項(xiàng)目 OpenRank 趨勢,幾乎個(gè)個(gè)「嘴角上揚(yáng)」,蒸蒸日上。
與此同時(shí),生態(tài)位之間也在激烈博弈中,變化最劇烈當(dāng)屬 Agent Framework 領(lǐng)域——
Dify、n8n、RAGFlow 等低代碼平臺(tái)工具漲幅顯著,高達(dá) 72.22%;而與此同時(shí),LangChain、LlamaIndex、AutoGen 等曾經(jīng)紅極一時(shí)的SDK范式整體下滑了 35.90%,跌幅居首。
這可能意味著一個(gè)轉(zhuǎn)向——
從服務(wù)開發(fā)者「寫代碼拼接智能體」,轉(zhuǎn)向更注重用戶的「可視化、可定制、業(yè)務(wù)級可落地」的平臺(tái)產(chǎn)品。
低代碼平臺(tái)躍升至最頂端,而 SDK 范式則集體「下滑到底」。
看見未來:七大趨勢浮出水面
除了生態(tài)全景掃描,通過追蹤 GitHub 上 135 個(gè)核心項(xiàng)目近兩年的活躍度、技術(shù)走向與社區(qū)反饋,報(bào)告也歸納出七條值得所有開發(fā)者、創(chuàng)業(yè)者關(guān)注的趨勢
前三個(gè)聚焦智能體應(yīng)用層,后四個(gè)圍繞模型基礎(chǔ)設(shè)施層
最具體感的趨勢都集中在了智能體應(yīng)用,而且兩個(gè)都與 Manus 爆火有關(guān)。
2025年,Agent 框架熱潮褪去。從 2024 年下半年開始,LangChain 等早期 SDK 型框架的熱度開始「下臺(tái)階」式回落,新框架鮮有涌現(xiàn),開發(fā)者重心悄然轉(zhuǎn)移。而到了 2025 年,Dify、RAGFlow 等低代碼工作流平臺(tái)因契合企業(yè)需求迅速崛起(也是從中國開發(fā)者社區(qū)中生長出來的強(qiáng)勢項(xiàng)目)。
Agent框架OpenRank排名前十的變化
如何理解新框架在 2025 年褪潮?在發(fā)布現(xiàn)場的圓桌討論中,幾位智能體框架圈的核心研發(fā)者表示——
與其說褪去,不如說 Agent 框架來到下半場
過去兩年,「上半場」的主旋律是開發(fā)者工具:大模型剛嶄露頭角,各類框架如 LangChain、AutoGen、LlamaIndex 等紛紛涌現(xiàn),爭相為開發(fā)者搭建「腳手架」。隨著 Agent 流程逐漸標(biāo)準(zhǔn)化,開發(fā)者不再需要五花八門的新框架,
恰在此時(shí),Manus 的「一鍵即用」體驗(yàn)爆火,讓業(yè)界意識(shí)到端到端的極致體驗(yàn)可以為很多用戶接受。在「下半場」,Agent 框架更注重應(yīng)用場景落地,幫助普通用戶完成更復(fù)雜任務(wù)。當(dāng)然,解決真實(shí)場景的任務(wù)時(shí)需要強(qiáng)化學(xué)習(xí),還面臨不少挑戰(zhàn)(如獎(jiǎng)勵(lì)設(shè)計(jì))。
預(yù)測同時(shí)指出,2025 年低代碼平臺(tái)強(qiáng)勢崛起,表明 Agent 框架的競爭從比拼技術(shù)范式,走向比拼「誰能更快成為企業(yè)的生產(chǎn)力工具」。那些技術(shù)節(jié)奏穩(wěn)、商業(yè)理解深的開源平臺(tái),正乘勢成為「 AI 新基建」的領(lǐng)跑者,Dify 就是代表之一。
除了框架圈,Manus 更撬動(dòng)了「大廠覺醒」,連夜啟動(dòng)配套建設(shè),尤其是標(biāo)準(zhǔn)協(xié)議層
MCP 一出,標(biāo)準(zhǔn)協(xié)議層正式登場,大廠幾乎傾巢而出——
有了它,直接盤活沉淀多年的「互聯(lián)網(wǎng)家業(yè)」,現(xiàn)在一鍵接入,就能組成一個(gè)能辦事、能協(xié)作的 Agent,觸達(dá)生活的每一個(gè)角落。
緊接著,Google 在 2025 年開源 A2A( Agent2Agent ) 協(xié)議,解決 Agent 之間互操作的問題;CopilotKit 又推出的 AG-UI 協(xié)議 進(jìn)一步打通了智能體后端與前端用戶。
不過,發(fā)布現(xiàn)場的圓桌討論中,開發(fā)者們也指出 Agent 間的協(xié)作與傳統(tǒng)工具調(diào)用很不同——
它往往是一個(gè)持續(xù)十幾分鐘乃至更長的「長程任務(wù)」,在執(zhí)行過程中需要頻繁與提供方交互。因此,協(xié)議不僅要能傳遞信息,更要支持任務(wù)狀態(tài)的維護(hù)、過程控制和動(dòng)態(tài)交互能力。
而目前的 MCP 協(xié)議沒有涵蓋這些能力,A2A 解決的還是「連得上」的問題,「協(xié)作」仍是未解之題。這一領(lǐng)域仍有廣闊優(yōu)化空間,也為開源社區(qū)留下了巨大的創(chuàng)新機(jī)會(huì)。
預(yù)測也指出,未來需要原生為大模型場景設(shè)計(jì)的新協(xié)議,而在這場技術(shù)升級中,開源生態(tài)將成為關(guān)鍵陣地。
誰能率先定義這些新協(xié)議,并將其與工具鏈(如 SDK、框架)打通,誰就有機(jī)會(huì)建立自己的技術(shù)閉環(huán),搶占「模型即服務(wù)( MaaS )」時(shí)代的生態(tài)制高點(diǎn)??梢灶A(yù)見,未來一到兩年,標(biāo)準(zhǔn)協(xié)議層將迎來激烈的生態(tài)博弈期。
再來看 AI Coding。寫代碼是大模型與生俱來的優(yōu)勢,AI 編程項(xiàng)目確實(shí)紅火,幾乎個(gè)個(gè)「嘴角上揚(yáng)」。
根據(jù)項(xiàng)目的智能化程度(輔助還是完全替代?)以及目標(biāo)受眾群體(專業(yè)人士還是普通用戶?)的專業(yè)化程度,將這些 GitHub 上熱門的 AI Coding 類開源項(xiàng)目劃分為四個(gè)象限。
國內(nèi)百度、阿里、騰訊、螞蟻、字節(jié)等陸續(xù)推出 AI 代碼助手,率先跑馬圈地。AI Coding 也成為開源生態(tài)中少數(shù)幾個(gè)不依賴獨(dú)占數(shù)據(jù)、也不被私有場景鎖死的活躍賽道。連 OpenAI 都愿意為此砸下 30 億美元,收購 AI 開發(fā)工具 Windsurf,可見這條賽道含金量之高。
如今,AI 代碼助手已深度介入整個(gè)軟件開發(fā)流程:從需求理解、系統(tǒng)設(shè)計(jì),到前后端開發(fā)、測試調(diào)試,再到上線與運(yùn)維。有意思的是,真正「帶它上路」的,是程序員自己。但要說全面替代程序員?還遠(yuǎn)得很。
目前的 AI 編程助手,大致處于「智能輔助駕駛」階段,能在特定任務(wù)上獨(dú)立作業(yè),比如自動(dòng)生成前端頁面、小程序骨架、測試腳本、代碼檢查等。
技術(shù)演進(jìn)的關(guān)鍵瓶頸,預(yù)測明確指出有兩個(gè):一是上下文感知能力( Context-Awareness ),二是領(lǐng)域知識(shí)融合( Domain Knowledge Integration )。在未來 24 個(gè)月里,AI 助手的「接單能力」會(huì)不斷增強(qiáng),但在人機(jī)共創(chuàng)的長期范式中,關(guān)鍵決策權(quán),仍牢牢掌握在人類程序員手中
與應(yīng)用層的「生死時(shí)速」不同,一旦「下沉」到基礎(chǔ)設(shè)施,趨勢變化更像是靜水深流。
ChatGPT 和其他大語言模型的爆火,一度把「潑天的富貴」砸向了向量數(shù)據(jù)庫,一時(shí)間風(fēng)頭無兩。但熱潮也很快退去,發(fā)展趨勢逐漸趨于平穩(wěn)。最近兩年,它們既沒被「拍死」,也沒卷出新高度,更多是以「相敬如賓」的姿態(tài)各自發(fā)展。
有關(guān)「向量數(shù)據(jù)庫是不是偽需求」,一直爭議不斷。從當(dāng)前的穩(wěn)定趨勢來看,它可能確實(shí)是一項(xiàng)真需求。
向量數(shù)據(jù)庫的每月 Star 增量變化
預(yù)測指出,技術(shù)「厚不厚」不是重點(diǎn),關(guān)鍵是有沒有持續(xù)迭代的范式空間。對向量數(shù)據(jù)庫來說,短期看是穩(wěn)定期,但中長期是否能迎來「第二曲線」,還要看 AI 生態(tài)新場景的開拓速度。
發(fā)布現(xiàn)場的圓桌討論中,Zilliz 合伙人、技術(shù)總監(jiān)欒小凡還提到一個(gè)很有意思的點(diǎn)——
向量數(shù)據(jù)庫不僅是模型應(yīng)用階段的「召回引擎」,也正在成為訓(xùn)練流程中的「數(shù)據(jù)發(fā)現(xiàn)器」。
如在自動(dòng)駕駛場景中,如果模型在「紅燈前突然竄出一只狗」這類邊緣案例中表現(xiàn)不佳,就需要通過數(shù)據(jù)回溯找到類似樣本,進(jìn)一步強(qiáng)化訓(xùn)練。但這類數(shù)據(jù)往往來自非結(jié)構(gòu)化源,如網(wǎng)頁爬蟲、文本、視頻等,難以通過傳統(tǒng)標(biāo)簽化方式精準(zhǔn)搜集。
此時(shí),向量數(shù)據(jù)庫的價(jià)值就體現(xiàn)出來了——
它能幫助我們高效從海量異構(gòu)數(shù)據(jù)中,按語義相似性快速定位相關(guān)樣本,從而實(shí)現(xiàn)更精準(zhǔn)的「問題驅(qū)動(dòng)式數(shù)據(jù)提取」,支持面向真實(shí)任務(wù)場景的精細(xì)化訓(xùn)練。
談到大模型訓(xùn)練和推理,我立刻想到「源神」DeepSeek 的一段話:
我們非常感謝開源生態(tài)系統(tǒng),沒有它,我們不可能在通用人工智能 (AGI) 方面取得進(jìn)展。我們的訓(xùn)練框架依賴于 PyTorch,我們的推理引擎基于 vLLM,這兩者都對加速 DeepSeek 模型的訓(xùn)練和部署起到了重要作用。
要說 PyTorch,人人都承認(rèn)它的領(lǐng)先,但沒想到它居然領(lǐng)先到了「一統(tǒng)江湖」的地步。
而一旦進(jìn)入推理環(huán)節(jié),很多開發(fā)者都關(guān)心一個(gè)問題:性能被拉到一個(gè)新高度,怎么提高模型的推理速度?2023 年以來,出現(xiàn)了一大波面向于模型部署和高效推理的大模型服務(wù)工具,在性能和生態(tài)上彼此追趕,混戰(zhàn)一直持續(xù)到今天。
眼下,vLLM 與 SGLang已是當(dāng)之無愧的「推理頂流」,社區(qū)影響力持續(xù)擴(kuò)張。
從 Top 10 的模型服務(wù)項(xiàng)目的排名變化上來看,仍有新的項(xiàng)目不斷冒出來,并吸引開發(fā)者參與到其中去。例如去年 7 月清華推出的 KTransformers 和今年 3 月 NVIDIA 推出的 Dynamo。
幾大模型服務(wù)項(xiàng)目的 OpenRank 曲線變化
2023 年 6 月,vLLM 首次發(fā)布,被視為大語言模型推理的分水嶺:在不改動(dòng)模型結(jié)構(gòu)的前提下,它顯著壓縮顯存占用、提升并發(fā)能力,是首個(gè)對 LLM 推理進(jìn)行系統(tǒng)級重構(gòu)的開源引擎。2025年,vLLM 發(fā)布 v1,完成核心架構(gòu)升級后重回增長通道,依舊是主流部署場景中的首選框架,并具備更強(qiáng)的商業(yè)集成度。
SGLang 屬于后者居上—— 2024 年 1 月發(fā)布,定位更貼近真實(shí) Agent 應(yīng)用場景,不僅具備更強(qiáng)的 GPU 并發(fā)調(diào)度能力,還支持多步推理優(yōu)化。2025 年一季度,其 OpenRank 增長達(dá) 31%,遠(yuǎn)超同期 vLLM 的 17%。
SGLang 也被用于重寫 Grok 2 推理技術(shù)棧,極大改善了產(chǎn)品體驗(yàn),甚至獲得馬斯克的公開點(diǎn)贊。
有個(gè)細(xì)節(jié),「一招鮮」也有高光時(shí)刻。
2025 年 2 月,清華大學(xué) KVCache.AI 團(tuán)隊(duì)推出的 KTransformers 破解千億級大模型本地部署難題,4090 單卡實(shí)現(xiàn) DeepSeek-R1 滿血運(yùn)行。
該項(xiàng)目 OpenRank 飆升 34 倍,吸引 736 名開發(fā)者參與協(xié)作,GitHub Star 數(shù)突破 1 萬??磥碓诖竽P蜁r(shí)代,哪怕是底層細(xì)節(jié)的優(yōu)化,也可能帶來「超級紅利」
最后,在多模態(tài)數(shù)據(jù)治理技術(shù)的演化上,湖倉「四足鼎立」, 為大模型所依賴的非結(jié)構(gòu)化海量數(shù)據(jù)提供更強(qiáng)的存儲(chǔ)與管理能力。元數(shù)據(jù)治理也開始擁抱非結(jié)構(gòu)化數(shù)據(jù)和 AI 資產(chǎn)管理。
不過,Data Infra 發(fā)展了二十年,發(fā)展得非常完善,有自己的方法論。而多模態(tài)原生數(shù)據(jù) Infra 才剛剛開始,用新的方式再做一遍時(shí),Data Infra 遭遇過的痛點(diǎn)可能會(huì)再度出現(xiàn)。
數(shù)據(jù)湖表格式項(xiàng)目 OpenRank 曲線變化
元數(shù)據(jù)治理項(xiàng)目 OpenRank 曲線變化
「撕拉片」的方法論
為什么要做這份報(bào)告?王旭回答很直接——
螞蟻的開源團(tuán)隊(duì)其實(shí)不叫「開源辦公室」,而是「開源技術(shù)增長」,一個(gè)立足架構(gòu)層的技術(shù)中樞,希望通過對開源社區(qū)的長期觀察,為螞蟻內(nèi)部的技術(shù)路徑提供決策支持。
相比 Gartner 這樣的傳統(tǒng)商業(yè)分析,開源社區(qū)數(shù)據(jù)能更早、更真實(shí)反映技術(shù)的風(fēng)向變化。
為構(gòu)建這張「撕拉片」,團(tuán)隊(duì)以 PyTorch、LangChain、vLLM 等 AI 明星項(xiàng)目為起點(diǎn),層層擴(kuò)展其技術(shù)上下游,并邀請行業(yè)專家討論,一步步收斂出百余個(gè)活躍度與影響力兼具的核心項(xiàng)目。
真正支撐判斷的,是 OpenRank——由華東師范大學(xué) X-lab 開發(fā)的開源影響力指標(biāo)。這次入選門檻是:2025 年 1 至 4 月的 OpenRank 月均值 ≥ 10。太舊、太新的項(xiàng)目都可能被篩掉。為了觀察趨勢,團(tuán)隊(duì)重點(diǎn)對比了項(xiàng)目和賽道的 OpenRank 均值變化。
發(fā)布會(huì)上,王旭還透露報(bào)告將在下半年推出更新版本。屆時(shí),低代碼平臺(tái)是否還能保持狂飆?協(xié)議層會(huì)否冒出新變量?AI Coding 是否還有驚喜?......
這場黑客松直播,還在繼續(xù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.