網易首頁 > 網易號 > 正文申請入駐

聊一聊 Tool、MCP 和 Agent 來龍去脈 | 大白話技術科普系列@Jomy

2025-04-14 19:26:06　來源: 一澤Eze

浙江舉報

分享至

將與 Jomy 共同完成一系列技術科普，讓最一線的工程師、用通俗的語言、講最前沿的技術。

這是系列第一篇，主題是最近大火的 MCP 和 Agent。

讀完本文，你一定會感嘆：終于搞懂了！原來！竟然！這么簡單！

文 | Jomy @302.AI

編 | 南喬River @ShowMeAI

???

我們 302.AI 做 MCP 和 Agent 相關開發有一段時間了，期間一直與開發者和用戶們保持著密切的交流。

有一個普遍的感受：盡管行業內幾乎所有人都聽過 MCP、Agent 這些術語，但只有極少數人真正理解它們的本質。

今天，我就基于 302.AI 的實踐和成果，分享一些自己的見解，幫大家厘清概念的來龍去脈，并大膽預測一下未來的發展方向。

1. 缸中之腦只能說不能做的大模型

讓我們先從大語言模型（Large Language Model，LLM）說起。

大語言模型，顧名思義，就是一個只能處理和輸出文字的系統。

早期的大語言模型，輸出非常不穩定，準確率很低，經常「一本正經地胡說八道」。

所以，人們最多把它當成一個顧問：咨詢意見，但不敢讓它直接拍板決策或上手干活。

這個時期的大模型，有點像被限制在「缸」里的「大腦」（借用哲學上的「缸中之腦」假說）。

它能思考、能滔滔不絕地輸出觀點。但它沒手沒腳，不能對「缸」外的物理世界/數字世界直接做點什么。

???

但是，AI 技術發展飛快。

隨著模型參數規模的擴大和訓練方法的革新，語言模型的「智力」得到了肉眼可見的提升。人們驚喜地發現，AI 寫出的文案、給到的建議、生成的代碼，幾乎不需要修改就能直接使用了！

眼看著 AI 越來越靠譜，一種想法自然而然地浮現出來：既然大模型這么能干，是時候解開 AI 的禁錮，讓它不只能「動動嘴」，也能「動動手」了？

2. 調用工具大模型學會了「動手」

怎么解開 AI 的「禁錮」呢？

答案就是讓大模型能夠自行使用工具，也就是我們常說的 Function Call（函數調用）或 Tool Use（工具使用）。

那么，一個只會輸出文字的模型，是如何調用工具的呢？

這里需要做一個必要的澄清：模型調用工具，并不是模型真的「動手」去操作工具。

本質上，還是模型生成文本（結構化的文本），然后配套的程序接收到指令，再去調用工具。（如下圖所示）

而所謂的「工具」，就是各種各樣的程序接口（API）或者軟件操作，例如搜索、編輯數據庫、編輯文件等。

gpt-4o 調用工具的命令（JSON 格式）

這就像給一個思維敏捷但行動不便的人，配備了一臺隨時待命的智能計算機。

他只需要「說」出來需要做什么，計算機就會自動決策和執行所有的指令，整個過程不再需要人類的介入。

???

讓 AI 模型使用工具，本質上是一種「放權」行為。

人們將 AI 從「缸」里釋放出來，允許 AI 通過調用工具，直接對現實世界或數字世界產生實際的影響。

這無疑是 AI 邁出的關鍵一步，也是 Agent 得以誕生的基石。

3. MCP 誕生不再重復造輪子

AI 學會了使用工具，這很好。

但很快就出現了新問題：每家公司、每個開發者都在用自己的方式定義和接入工具。這就導致了大量的重復勞動，并且工具難以復用和共享，只能「自己造自己用」。

MCP 統一了模型調用工具的方式

Anthropic 公司敏銳地發現了這個問題。他們認為，工具應該有一套通用的「語言」和「接口規范」，于是提出了 MCP（Model Context Protocol，模型上下文協議）。

這個協議對大模型發展的意義重大，完全可以類比為秦始皇當年規定的「書同文」和「車同軌」。從此，模型調用工具這個事情就被大大地加速了。

???

MCP 是什么呢？

簡單來說，它是一套定義大模型如何發現、理解和調用外部工具（或稱服務）的標準協議。

（MCP 中的 Prompt 和 Resource 暫且不論）

MCP 基本框架示意圖

它明確了兩個核心角色：

MCP Client（客戶端）：通常是使用工具的一方。一般是 AI 應用，比如 Claude 客戶端、Cursor 編程工具等。
MCP Server（服務端）：也就是提供工具的一方。任何擁有 API 或軟件服務的公司，都可以按照 MCP 規范把自己包裝成一個 MCP Server，把原來給人用的工具，改造成能讓 AI 理解和調用的工具。

Norah Sakal 這張「MCP architecture」圖非常出圈，說的是同一回事

???

前段時間，海外知名投資機構 a16z 制作了一份 MCP Market Map，梳理了 MCP 發展現狀。

可以看到，MCP Client 和 MCP Server 生態已經初具模型并在日益繁榮。（如下圖所示）

MCP 生態現狀

其中，在 MCP Marketplace 板塊，MCP.so 導航網站的制作者，就是國內知名的獨立開發者 idoubi。

目前，MCP.so 收錄的 MCP Server 數量已經超過了 7000 個，其中就包括 302.ai 的 Sandbox MCP Server 和 Browser MCP Server。

用戶只需要在客戶端連接這兩個 MCP Server，就可以讓 AI 對遠程 Linux 服務器和遠程瀏覽器進行操作，完成相應的任務，極其便利。

mcp.so 主頁截圖

4. Agent 誕生更好地調用工具

MCP 讓工具的供給變得更加方便了。

但新的挑戰接踵而至：一個 AI 模型能有效掌握和使用的工具數量是有限的。就像一個人能熟練掌握和使用的技能，也是有限的。

在人類社會里，每個人都專注于擅長的領域，以醫生、律師、教師、工程師、程序員等職業身份，把自己的事情做好。

AI 也是同理。

當工具不再是主要瓶頸后，如何讓 AI 模型更聰明、更高效地使用這些工具，就成了核心問題。

Agent 就在這個背景下誕生了。

Agent 最簡公式

我認為，理解 Agent 最簡單的一個公式就是

Agent = LLM + Tools

有工具使用權限的 AI 就是 Agent，中文翻譯成「代理人」，有些地方會翻譯為「智能體」。

Agent 最簡單的實現框架

現在，對于 Agent 的發展，業界有兩個大的方向：

通用 Agent（通才）：很多大模型公司都在往這個方向努力。但現階段，受限于模型能力等各方面的挑戰，這注定暫時只是一個美好的理想。
垂直 Agent（專才）：專注于解決特定領域或特定類型任務。目前看來更容易落地、也更有可能在短期內產生實際價值。

???

在垂直 Agent 優化實踐中，我們有幾條關鍵經驗，也在此分享給大家：

明確的指引。在實踐中體現為精準的系統提示詞。
垂直的工具。在實踐中體現為只接入任務強相關的 MCP Server。
完整的上下文。在實踐中體現為完善的任務描述和任務記憶。

讀到這里，你就已經追到了 AI Agent 領域發展的最前沿。

5. Agent 通信新的協議應運而生

然后，更新的挑戰又出現了。

單個垂直 Agent 能解決特定問題，但面對更復雜的現實任務，往往需要多個不同能力的垂直 Agent 協同配合。

現在，各家公司都在閉門造自己的 Agent。這些 Agent 之間缺乏統一的溝通方式和協作機制，注定重復且低效。

這有點像 MCP 出現之前的工具生態，又一次走到了需要「標準化」的路口，只不過這次標準化的對象是 Agent 本身。

???

為了解決 Agent 之間的信息互通問題，一些新的協議開始進入起草階段，其中比較受關注的有：

ANP（Agent Network Protocol）：中國開發者率先提出并推動的一個協議。
A2A（Agent-to-Agent）Protocol：Google 也在探索類似的概念和協議。

Google A2A Protocol 原理示意圖

這些協議的核心目標，大致可以歸納為兩點：

第一，讓 Agent 之間明確彼此的能力，便于協作。就像外包網站的個人主頁，清晰寫明自己的專長，其他人可以按需查找，找到合適了的人就一起做項目。
第二，讓 Agent 之間可以高效地傳遞信息。就像團隊協作之前，大家約定好溝通方式（比如人會約定好用飛書還是用釘釘）以及消息格式（類似布置任務需要包含哪些信息）。

至于未來哪個協議會成為主流，現在下結論還為時尚早。

但可以肯定的是，Agent 之間的互聯互通，將進一步釋放 AI 潛能，催生一個更加靠近 C 端（用戶端）、更加繁榮、更加有想象力的巨大市場。

6. 展望 2025 Agent 之年的無限機遇

最后，讓我們來系統回顧一下這條演進路徑：

隨著大模型能力的提升，AI 輸出的內容越來越靠譜。人們開始讓 AI 通過調用工具與外部世界直接交互，把 AI 變成了 Agent。
MCP 協議統一了工具的開發標準，從而簡化了 Agent 的開發難度。
現階段單個 Agent 無法很好地使用大量工具，所以垂直 Agent 成為了當前的主流。
垂直 Agent 之間需要配合才可以完成復雜的任務，這催生了 ANP / A2A 等新的互聯協議。

你看，技術的發展往往不是一蹴而就的。

每個重大節點（Function Call/Tool Use、Agent、MCP、ANP/A2A）的出現，背后都有其歷史必然性。

???

再往后呢？

考慮到當前基礎模型的發展速度和架構特點，我認為，垂直 Agent 市場將會在歷史舞臺上存在相當長的一段時間。

即使未來出現了能力極強的「超級通用 Agent」，在很多場景下，高度優化、成本可控的垂直 Agent 組合，可能仍然是更具性價比、更可靠的選擇。

恰似古語有云：三個臭皮匠，頂一個諸葛亮。

Agent 生態的爆發，可能來得比大多數人想象中還要快。

2025 是名副其實的 Agent 之年。這背后蘊藏著的，是巨大的技術變革和商業機會，以及我們這代人幾十年才得一遇的科技浪潮。

衷心希望我今天的分享，能幫你更好地理解這個正在發生的未來。也希望每一位在這個領域努力探索的朋友，都能抓住機遇，在今年摘取到屬于自己的勝利果實。

官方網站

302.AI: https://302.ai
MCP.so: https://mcp.so
Anthropic | Introducing the Model Context Protocol: https://www.anthropic.com/news/model-context-protocol
Anthropic | Model Context Protocol: https://modelcontextprotocol.io/introduction
ANP | Agent Network Protocol: https://agent-network-protocol.com
ANP | AgentNetworkProtocol: https://github.com/agent-network-protocol/AgentNetworkProtocol
A2A | A2A Protocol: https://google.github.io/A2A
A2A | Agent2Agent Protocol: https://github.com/google/A2A

Norah Sakal | What is Model Context Protocol (MCP)? How it simplifies AI integrations compared to APIs: https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained
a16z | A Deep Dive Into MCP and the Future of AI Tooling: https://a16z.com/a-deep-dive-into-mcp-and-the-future-of-ai-tooling
What is Model Context Protocol (MCP): Explained: https://composio.dev/blog/what-is-model-context-protocol-mcp-explained
What Is the Model Context Protocol (MCP) and How It Works: https://www.descope.com/learn/post/mcp#llm-isolation-&-the-nxm-problem
常高偉 | 多角度全面對比Google最新的A2A、ANP、MCP: https://mp.weixin.qq.com/s/n1R-wOtNBTKtHdIHOUhQmw
idoubi | 詳解 MCP 核心架構: https://mp.weixin.qq.com/s/uTsr06MnJ9t3sGDzLD99_g

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.