- 克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
終于!當(dāng)前的大模型開發(fā)生態(tài),被一份報(bào)告、完整全景圖譜講清楚了。
就在第十屆527螞蟻技術(shù)日上,螞蟻通過Coding范式、數(shù)據(jù)、模型部署等角度,對(duì)現(xiàn)有開源生態(tài)進(jìn)行了全面完整的大剖析,從數(shù)據(jù)的視角揭示了大模型開源生態(tài)的演進(jìn)規(guī)律,如果你是大模型開發(fā)者或者潛在的開發(fā)者,幾乎研究好這份報(bào)告可能就夠了。
但這還不夠,在報(bào)告出爐之前的周末,螞蟻還發(fā)布了2025大模型開源生態(tài)全景圖,涵蓋19個(gè)技術(shù)領(lǐng)域、135個(gè)項(xiàng)目,進(jìn)一步給出了大模型開發(fā)生態(tài)的參考系。
報(bào)告+圖譜,也讓這句“大模型開發(fā)生態(tài),是一場(chǎng)現(xiàn)實(shí)世界的黑客松”,在現(xiàn)場(chǎng)被開發(fā)者一遍遍討論。
是的,在介紹最新的開源生態(tài)報(bào)告時(shí),螞蟻開源委員會(huì)副主席王旭,就是這么感嘆的——
大模型開發(fā)生態(tài),是一場(chǎng)現(xiàn)實(shí)世界的黑客松。
大模型開源生態(tài),為何是一場(chǎng)實(shí)時(shí)直播的黑客馬拉松?
在去年的QCon(全球軟件開發(fā)大會(huì))上的報(bào)告和量子位的MEET 2025大會(huì)中,螞蟻對(duì)開源社區(qū)給出了這樣的判斷:
- 開源社區(qū)的數(shù)據(jù)可以說既不全面,也不超前于時(shí)代,但是,它是跳出公司的一個(gè)客觀視角。
今年的技術(shù)日上,螞蟻針對(duì)開源生態(tài)又發(fā)布了新的報(bào)告,以及新的開源生態(tài)全景圖。
這張全景圖涵蓋了一共19個(gè)技術(shù)領(lǐng)域的135個(gè)項(xiàng)目,從模型基礎(chǔ)設(shè)施層到智能體應(yīng)用層全面覆蓋。
開源開發(fā)世界的一個(gè)很大的優(yōu)點(diǎn)是,人可以從公開數(shù)據(jù)中看到開發(fā)者們的協(xié)作分布動(dòng)向,以此模擬項(xiàng)目們?cè)谏鷳B(tài)之中的關(guān)聯(lián)關(guān)系和生態(tài)位置。
所以,螞蟻選取了時(shí)下AI領(lǐng)域中大家最耳熟能詳?shù)囊恍╉?xiàng)目(例如PyTorch、LangChain、vLLM等),把它們作為種子節(jié)點(diǎn),然后通過開發(fā)者在GitHub上的不同項(xiàng)目之間產(chǎn)生的協(xié)作關(guān)聯(lián)關(guān)系,不斷去探查生態(tài)的多個(gè)側(cè)面。
同時(shí),為了呈現(xiàn)當(dāng)下最頂尖的和最火熱的開源項(xiàng)目,螞蟻選擇了華東師范大學(xué)X-lab實(shí)驗(yàn)室的OpenRank影響力評(píng)價(jià)指標(biāo)作為一個(gè)重要的數(shù)據(jù)依據(jù)——只有今年的OpenRank月均值大于10的項(xiàng)目,才會(huì)出現(xiàn)在全景圖上。
除了這張全景圖,螞蟻還專門列出了2025年排名Top 20的項(xiàng)目,以及增長(zhǎng)和下降最明顯的項(xiàng)目。
通過對(duì)這些項(xiàng)目的分析,螞蟻開源認(rèn)為,現(xiàn)在的開源生態(tài)中存在著三個(gè)主導(dǎo)的技術(shù)賽道——模型訓(xùn)練框架、高效推理引擎和低代碼應(yīng)用開發(fā)框架
- 訓(xùn)練上,PyTorch在全景圖中的所有項(xiàng)目中影響力位列第一;
- 推理上,高效推理引擎vLLM和SGlang在過去一年都處于飛速迭代之中,分別位于OpenRank同比增長(zhǎng)的第一和第三位;
- 應(yīng)用側(cè),結(jié)合低代碼工具鏈和RAG知識(shí)檢索管理技術(shù)的Dify和RAGFlow,正在高速增長(zhǎng),而這兩個(gè)應(yīng)用開發(fā)平臺(tái)都是從中國(guó)開發(fā)者社區(qū)中生長(zhǎng)出來的強(qiáng)勢(shì)項(xiàng)目。
同時(shí),通過這張全景圖,螞蟻開源也發(fā)現(xiàn)如今的AI技術(shù)擴(kuò)散速度遠(yuǎn)超預(yù)期,在這樣的環(huán)境下,大模型開發(fā)生態(tài)正演變?yōu)橐粓?chǎng)在真實(shí)世界發(fā)生的、實(shí)時(shí)公開直播的黑客松
AI開源生態(tài)的七大趨勢(shì)
從這場(chǎng)“黑客松”當(dāng)中,開源生態(tài)當(dāng)中的一些趨勢(shì)也逐漸顯現(xiàn),螞蟻開源一共總結(jié)出了七條,具體可以分為應(yīng)用和基礎(chǔ)設(shè)施兩個(gè)層次。
首先,從應(yīng)用層,或者說Coding范式上來看:
- Agent框架熱潮褪去,低代碼開發(fā)方式正成為新主流;
- 標(biāo)準(zhǔn)協(xié)議層,將成為兵家必爭(zhēng)的戰(zhàn)略要塞;
- Vibe Coding新范式雖然被“嫌棄”,但開發(fā)者已經(jīng)紛紛“真香”。
雖然AI智能體是當(dāng)下AI應(yīng)用領(lǐng)域當(dāng)之無愧的熱門,不過智能體的開發(fā)模式相比之前已經(jīng)發(fā)生了很大變化。
具體來說,2025年,Dify、RAGFlow等平臺(tái)通過低代碼工作流和企業(yè)級(jí)服務(wù)的落地開始主導(dǎo)市場(chǎng);而以LangChain和LlamaIndex為代表的傳統(tǒng)開發(fā)框架日漸式微。
而Dify一躍而起,成為當(dāng)前最熱門的AI應(yīng)用開發(fā)平臺(tái),螞蟻開源認(rèn)為其關(guān)鍵在于精準(zhǔn)把握了企業(yè)級(jí)用戶的需求——
一方面通過直觀的可視化工作流編排大幅降低技術(shù)門檻,另一方面則提供完善的企業(yè)級(jí)安全管控方案。
據(jù)此,螞蟻開源認(rèn)為,易用性、快速構(gòu)建或許是當(dāng)下應(yīng)用開發(fā)框架的關(guān)鍵標(biāo)簽
框架之外,隨著大模型應(yīng)用進(jìn)入智能體時(shí)代,還需要模型與應(yīng)用、模型與模型之間的通信標(biāo)準(zhǔn)。
2024年11月,Anthropic開源了MCP(模型上下文)協(xié)議,為智能體與工具之間的通信提供了標(biāo)準(zhǔn)化的接口,此后各個(gè)大模型都快速跟進(jìn)并支持了MCP,使之成為了目前實(shí)現(xiàn)大模型Agent調(diào)用外部工具資源的事實(shí)性標(biāo)準(zhǔn);
今年,Google又開源了智能體間協(xié)議(A2A) 協(xié)議,規(guī)定了不同Agent應(yīng)用之間的交流和互操作范式,之后CopilotKit又推出智能體用戶交互(AG-UI)協(xié)議,用于標(biāo)準(zhǔn)化智能體后端調(diào)用的工具和前端用戶界面之間的交互層。
這些協(xié)議無疑是促進(jìn)大模型應(yīng)用標(biāo)準(zhǔn)化的重要推動(dòng)力,但離真正形成完善的體系還有差距,需要原生協(xié)議創(chuàng)新。
主導(dǎo)標(biāo)準(zhǔn)制定的先行者,將可通過協(xié)議制定權(quán)在模型即服務(wù)(MaaS)時(shí)代構(gòu)筑生態(tài)護(hù)城河。
這意味著,隨著大模型服務(wù)的加速演進(jìn),標(biāo)準(zhǔn)協(xié)議層會(huì)成為頭部玩家的戰(zhàn)略要塞
工具層面,被程序員們嘴上嫌棄的Vibe Coding范式已經(jīng)變成“真香”,并且,一些創(chuàng)業(yè)公司或三五人的小團(tuán)隊(duì)能夠快速產(chǎn)出一個(gè)該領(lǐng)域的開源項(xiàng)目,迅速出圈
并且,AI Coding也正在嘗試從一次性代碼生成,走向真實(shí)的軟件工程場(chǎng)景下的開發(fā)
除了應(yīng)用,螞蟻報(bào)告也從基礎(chǔ)設(shè)施一側(cè)分析了開源生態(tài)現(xiàn)狀,得到了以下四大結(jié)論:
- 向量索引與存儲(chǔ)技術(shù),正在回歸理性的沉淀;
- 多模態(tài)時(shí)代,大數(shù)據(jù)和AI生態(tài)的融合還在路上;
- 模型服務(wù)部署與推理的混戰(zhàn)仍在持續(xù);
- 大模型的訓(xùn)練生態(tài),仍然以PyTorch為核心。
可以說,螞蟻的這份報(bào)告,對(duì)當(dāng)今的開源生態(tài)進(jìn)行了鞭辟入里的分析,那么,它又能給從業(yè)者帶來什么樣的思考呢?
生態(tài)風(fēng)云變幻,從業(yè)者該怎么做?
這些趨勢(shì)代表了開源生態(tài)的一些主流選擇,但是并不會(huì)憑空產(chǎn)生,其背后存在的共同驅(qū)動(dòng)力依然值得探討。
從Chatbot到智能體,AI應(yīng)用的形式變得越來越高端,功能越來越豐富,但基礎(chǔ)的技術(shù)卻在逐步普及化,應(yīng)用開發(fā)門檻反而正在降低。
但技術(shù)難度降低帶來應(yīng)用爆發(fā)的同時(shí),也讓開發(fā)者之間的競(jìng)爭(zhēng)變得更加激烈。
這樣激烈的競(jìng)爭(zhēng),也正在迫使開源從業(yè)者尋找新的差異化路徑。
對(duì)規(guī)模較大、已經(jīng)掌握部分話語權(quán)的開發(fā)者來說,從單點(diǎn)工具轉(zhuǎn)向生態(tài)控制權(quán),是在競(jìng)爭(zhēng)中取勝的關(guān)鍵。
比如在七大趨勢(shì)當(dāng)中,PyTorch一騎絕塵的核心奧義,正是幾乎牢牢把握住了整個(gè)模型訓(xùn)練的入口。
趨勢(shì)中所指出的“探索新的原生標(biāo)準(zhǔn)化形式”,也是基于同樣的思路。
當(dāng)然,生態(tài)并不是所有人都有能力建立,事實(shí)上,即便是Anthropic這樣的MCP提出者,也很難說擁有大模型應(yīng)用生態(tài)的護(hù)城河。
那么一般的開發(fā)者又該如何獲得自己的競(jìng)爭(zhēng)優(yōu)勢(shì)呢?深耕場(chǎng)景、提升用戶體驗(yàn),是一種可行的路徑。
前面提到的Dify、RAGFlow等平臺(tái),走的就是這一條路線,通過低代碼的方式降低了開發(fā)使用門檻,可謂是摸準(zhǔn)了企業(yè)用戶的脈門。
更宏觀上看,開源生態(tài)的發(fā)展,也存在著許多“變與不變”。
變化的是,項(xiàng)目周期正在縮短,從業(yè)者的試錯(cuò)門檻也在降低,開發(fā)模式從“厚積薄發(fā)”轉(zhuǎn)向“敢于試錯(cuò)”。
但不變的是,開發(fā)者的目標(biāo)始終是為用戶創(chuàng)造價(jià)值,而“簡(jiǎn)化復(fù)雜性、提升效率”,就是具體的路徑。
總而言之,通過數(shù)據(jù)化的視角,螞蟻用135個(gè)項(xiàng)目的具體數(shù)據(jù),準(zhǔn)確捕捉了當(dāng)前AI開源項(xiàng)目的特征。
通過對(duì)七大技術(shù)趨勢(shì)的分析,報(bào)告也揭示了大模型開源生態(tài)的演進(jìn)規(guī)律,為理解整個(gè)生態(tài)的發(fā)展方向提供了重要參考。
對(duì)于具體的技術(shù)從業(yè)者,這份報(bào)告也提供了一個(gè)相對(duì)完整的大模型開源生態(tài)地圖,有助于技術(shù)選型和趨勢(shì)判斷。
這份報(bào)告的意義不在于預(yù)測(cè)哪個(gè)項(xiàng)目會(huì)成功或者值得押注,而在于可以幫助理解技術(shù)生態(tài)演進(jìn)的內(nèi)在機(jī)制。
也就說是,千遍萬遍,規(guī)律不變,而這份報(bào)告,講的就是大模型開源生態(tài)最底層的基本規(guī)律。
報(bào)告地址:https://mp.weixin.qq.com/s/2xwyGPZppdYmU_cDX3Xhyg
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.