將與 Jomy 共同完成一系列技術科普,讓最一線的工程師、用通俗的語言、講最前沿的技術。
這是系列第一篇,主題是最近大火的 MCP 和 Agent。
讀完本文,你一定會感嘆:終于搞懂了!原來!竟然!這么簡單!
文 | Jomy @302.AI
編 | 南喬River @ShowMeAI
???
我們 302.AI 做 MCP 和 Agent 相關開發有一段時間了,期間一直與開發者和用戶們保持著密切的交流。
有一個普遍的感受:盡管行業內幾乎所有人都聽過 MCP、Agent 這些術語,但只有極少數人真正理解它們的本質。
今天,我就基于 302.AI 的實踐和成果,分享一些自己的見解,幫大家厘清概念的來龍去脈,并大膽預測一下未來的發展方向。
1. 缸中之腦 只能說不能做的大模型
讓我們先從大語言模型(Large Language Model,LLM)說起。
大語言模型,顧名思義,就是一個只能處理和輸出文字的系統。
早期的大語言模型,輸出非常不穩定,準確率很低,經常「一本正經地胡說八道」。
所以,人們最多把它當成一個顧問:咨詢意見,但不敢讓它直接拍板決策或上手干活。
這個時期的大模型,有點像被限制在「缸」里的「大腦」(借用哲學上的「缸中之腦」假說)。
它能思考、能滔滔不絕地輸出觀點。但它沒手沒腳,不能對「缸」外的物理世界/數字世界直接做點什么。
???
但是,AI 技術發展飛快。
隨著模型參數規模的擴大和訓練方法的革新,語言模型的「智力」得到了肉眼可見的提升。人們驚喜地發現,AI 寫出的文案、給到的建議、生成的代碼,幾乎不需要修改就能直接使用了!
眼看著 AI 越來越靠譜,一種想法自然而然地浮現出來:既然大模型這么能干,是時候解開 AI 的禁錮,讓它不只能「動動嘴」,也能「動動手」了?
2. 調用工具 大模型學會了「動手」
怎么解開 AI 的「禁錮」呢?
答案就是讓大模型能夠自行使用工具,也就是我們常說的 Function Call(函數調用)或 Tool Use(工具使用)。
那么,一個只會輸出文字的模型,是如何調用工具的呢?
這里需要做一個必要的澄清:模型調用工具,并不是模型真的「動手」去操作工具。
本質上,還是模型生成文本(結構化的文本),然后配套的程序接收到指令,再去調用工具。(如下圖所示)
而所謂的「工具」,就是各種各樣的程序接口(API)或者軟件操作,例如搜索、編輯數據庫、編輯文件等。
gpt-4o 調用工具的命令(JSON 格式)
這就像給一個思維敏捷但行動不便的人,配備了一臺隨時待命的智能計算機。
他只需要「說」出來需要做什么,計算機就會自動決策和執行所有的指令,整個過程不再需要人類的介入。
???
讓 AI 模型使用工具,本質上是一種「放權」行為。
人們將 AI 從「缸」里釋放出來,允許 AI 通過調用工具,直接對現實世界或數字世界產生實際的影響。
這無疑是 AI 邁出的關鍵一步,也是 Agent 得以誕生的基石。
3. MCP 誕生 不再重復造輪子
AI 學會了使用工具,這很好。
但很快就出現了新問題:每家公司、每個開發者都在用自己的方式定義和接入工具。這就導致了大量的重復勞動,并且工具難以復用和共享,只能「自己造自己用」。
MCP 統一了模型調用工具的方式
Anthropic 公司敏銳地發現了這個問題。他們認為,工具應該有一套通用的「語言」和「接口規范」,于是提出了 MCP(Model Context Protocol,模型上下文協議)。
這個協議對大模型發展的意義重大,完全可以類比為秦始皇當年規定的「書同文」和「車同軌」。從此,模型調用工具這個事情就被大大地加速了。
???
MCP 是什么呢?
簡單來說,它是一套定義大模型如何發現、理解和調用外部工具(或稱服務)的標準協議。
(MCP 中的 Prompt 和 Resource 暫且不論)
MCP 基本框架示意圖
它明確了兩個核心角色:
- MCP Client(客戶端): 通常是使用工具的一方。一般是 AI 應用,比如 Claude 客戶端、Cursor 編程工具等。
- MCP Server(服務端): 也就是提供工具的一方。任何擁有 API 或軟件服務的公司,都可以按照 MCP 規范把自己包裝成一個 MCP Server,把原來給人用的工具,改造成能讓 AI 理解和調用的工具。
Norah Sakal 這張「MCP architecture」圖非常出圈,說的是同一回事
???
前段時間,海外知名投資機構 a16z 制作了一份 MCP Market Map,梳理了 MCP 發展現狀。
可以看到,MCP Client 和 MCP Server 生態已經初具模型并在日益繁榮。(如下圖所示)
MCP 生態現狀
其中,在 MCP Marketplace 板塊,MCP.so 導航網站的制作者,就是國內知名的獨立開發者 idoubi。
目前,MCP.so 收錄的 MCP Server 數量已經超過了 7000 個,其中就包括 302.ai 的 Sandbox MCP Server 和 Browser MCP Server。
用戶只需要在客戶端連接這兩個 MCP Server,就可以讓 AI 對遠程 Linux 服務器和遠程瀏覽器進行操作,完成相應的任務,極其便利。
mcp.so 主頁截圖
4. Agent 誕生 更好地調用工具
MCP 讓工具的供給變得更加方便了。
但新的挑戰接踵而至:一個 AI 模型能有效掌握和使用的工具數量是有限的。就像一個人能熟練掌握和使用的技能,也是有限的。
在人類社會里,每個人都專注于擅長的領域,以醫生、律師、教師、工程師、程序員等職業身份,把自己的事情做好。
AI 也是同理。
當工具不再是主要瓶頸后,如何讓 AI 模型更聰明、更高效地使用這些工具,就成了核心問題。
Agent 就在這個背景下誕生了。
Agent 最簡公式
我認為,理解 Agent 最簡單的一個公式就是
Agent = LLM + Tools
有工具使用權限的 AI 就是 Agent,中文翻譯成「代理人」,有些地方會翻譯為「智能體」。
Agent 最簡單的實現框架
現在,對于 Agent 的發展,業界有兩個大的方向:
- 通用 Agent(通才):很多大模型公司都在往這個方向努力。但現階段,受限于模型能力等各方面的挑戰,這注定暫時只是一個美好的理想。
- 垂直 Agent(專才): 專注于解決特定領域或特定類型任務。目前看來更容易落地、也更有可能在短期內產生實際價值。
???
在垂直 Agent 優化實踐中,我們有幾條關鍵經驗,也在此分享給大家:
- 明確的指引。在實踐中體現為精準的系統提示詞。
- 垂直的工具。在實踐中體現為只接入任務強相關的 MCP Server。
- 完整的上下文。在實踐中體現為完善的任務描述和任務記憶。
讀到這里,你就已經追到了 AI Agent 領域發展的最前沿。
5. Agent 通信 新的協議應運而生
然后,更新的挑戰又出現了。
單個垂直 Agent 能解決特定問題,但面對更復雜的現實任務,往往需要多個不同能力的垂直 Agent 協同配合。
現在,各家公司都在閉門造自己的 Agent。這些 Agent 之間缺乏統一的溝通方式和協作機制,注定重復且低效。
這有點像 MCP 出現之前的工具生態,又一次走到了需要「標準化」的路口,只不過這次標準化的對象是 Agent 本身。
???
為了解決 Agent 之間的信息互通問題,一些新的協議開始進入起草階段,其中比較受關注的有:
- ANP(Agent Network Protocol):中國開發者率先提出并推動的一個協議。
- A2A(Agent-to-Agent)Protocol:Google 也在探索類似的概念和協議。
Google A2A Protocol 原理示意圖
這些協議的核心目標,大致可以歸納為兩點:
- 第一,讓 Agent 之間明確彼此的能力,便于協作。就像外包網站的個人主頁,清晰寫明自己的專長,其他人可以按需查找,找到合適了的人就一起做項目。
- 第二,讓 Agent 之間可以高效地傳遞信息。就像團隊協作之前,大家約定好溝通方式(比如人會約定好用飛書還是用釘釘)以及消息格式(類似布置任務需要包含哪些信息)。
至于未來哪個協議會成為主流,現在下結論還為時尚早。
但可以肯定的是,Agent 之間的互聯互通,將進一步釋放 AI 潛能,催生一個更加靠近 C 端(用戶端)、更加繁榮、更加有想象力的巨大市場。
6. 展望 2025 Agent 之年的無限機遇
最后,讓我們來系統回顧一下這條演進路徑:
- 隨著大模型能力的提升,AI 輸出的內容越來越靠譜。人們開始讓 AI 通過調用工具與外部世界直接交互,把 AI 變成了 Agent。
- MCP 協議統一了工具的開發標準,從而簡化了 Agent 的開發難度。
- 現階段單個 Agent 無法很好地使用大量工具,所以垂直 Agent 成為了當前的主流。
- 垂直 Agent 之間需要配合才可以完成復雜的任務,這催生了 ANP / A2A 等新的互聯協議。
你看,技術的發展往往不是一蹴而就的。
每個重大節點(Function Call/Tool Use、Agent、MCP、ANP/A2A)的出現,背后都有其歷史必然性。
???
再往后呢?
考慮到當前基礎模型的發展速度和架構特點,我認為,垂直 Agent 市場將會在歷史舞臺上存在相當長的一段時間。
即使未來出現了能力極強的「超級通用 Agent」,在很多場景下,高度優化、成本可控的垂直 Agent 組合,可能仍然是更具性價比、更可靠的選擇。
恰似古語有云:三個臭皮匠,頂一個諸葛亮。
Agent 生態的爆發,可能來得比大多數人想象中還要快。
2025 是名副其實的 Agent 之年。這背后蘊藏著的,是巨大的技術變革和商業機會,以及我們這代人幾十年才得一遇的科技浪潮。
衷心希望我今天的分享,能幫你更好地理解這個正在發生的未來。也希望每一位在這個領域努力探索的朋友,都能抓住機遇,在今年摘取到屬于自己的勝利果實。
官方網站
- 302.AI: https://302.ai
- MCP.so: https://mcp.so
- Anthropic | Introducing the Model Context Protocol: https://www.anthropic.com/news/model-context-protocol
- Anthropic | Model Context Protocol: https://modelcontextprotocol.io/introduction
- ANP | Agent Network Protocol: https://agent-network-protocol.com
- ANP | AgentNetworkProtocol: https://github.com/agent-network-protocol/AgentNetworkProtocol
- A2A | A2A Protocol: https://google.github.io/A2A
- A2A | Agent2Agent Protocol: https://github.com/google/A2A
- Norah Sakal | What is Model Context Protocol (MCP)? How it simplifies AI integrations compared to APIs: https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained
- a16z | A Deep Dive Into MCP and the Future of AI Tooling: https://a16z.com/a-deep-dive-into-mcp-and-the-future-of-ai-tooling
- What is Model Context Protocol (MCP): Explained: https://composio.dev/blog/what-is-model-context-protocol-mcp-explained
- What Is the Model Context Protocol (MCP) and How It Works: https://www.descope.com/learn/post/mcp#llm-isolation-&-the-nxm-problem
- 常高偉 | 多角度全面對比Google最新的A2A、ANP、MCP: https://mp.weixin.qq.com/s/n1R-wOtNBTKtHdIHOUhQmw
- idoubi | 詳解 MCP 核心架構: https://mp.weixin.qq.com/s/uTsr06MnJ9t3sGDzLD99_g
Powered by
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.