99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Anthropic工程師教你怎么做AI Agent:不做全場景、保持簡單,像Agent一樣思考

0
分享至

文章轉載自「INDIGO 科技加速站」


Anthropic 工程師 Barry Zhang 在 AI Engineer 工作坊上的一個分享 “如何構建有效的 Agent”,其中印象最深的一個觀點:Don't build agents for everything,反過來理解就是別做什么都能干的 Agent,那是我們大模型要干的事情


構建有效 Agent 的三大要點:

  1. 明智選擇應用場景,并非所有任務都需要 Agent

  2. 找到合適的用例后,盡可能長時間地保持系統簡單

  3. 在迭代過程中,嘗試從 Agent 的視角思考,理解其局限并提供幫助

Barry 主要負責 Agentic System,演講內容基于他和 Eric 合著的一篇博文,下面詳細總結他們的核心觀點,以及對 Agent 系統的演進和未來的思考。

Agent 系統的演進

  1. 簡單功能(Simple Features):起初是簡單的任務,如摘要、分類、提取,這些在幾年前看似神奇,現在已成為基礎。

  2. 工作流(Workflows):隨著模型和產品成熟,開始編排多個模型調用,形成預定義的控制流,以犧牲成本和延遲換取更好性能。這被認為是 Agent 系統的前身。

  3. Agent:當前階段,模型能力更強,領域特定的 Agent 開始出現。與工作流不同,Agent 可以根據環境反饋自主決定行動路徑,幾乎獨立運作。

  4. 未來(猜測):可能是更通用的單一 Agent,或多 Agent 協作。趨勢是賦予系統更多自主權,使其更強大有用,但也伴隨著更高的成本、延遲和錯誤后果。


Founder Park 正在搭建開發者社群,邀請積極嘗試、測試新模型、新技術的開發者、創業者們加入,請掃碼詳細填寫你的產品/項目信息,通過審核后工作人員會拉你入群~

進群之后,你有機會得到:

  • 高濃度的主流模型(如 DeepSeek 等)開發交流;

  • 資源對接,與 API、云廠商、模型廠商直接交流反饋的機會;

  • 好用、有趣的產品/案例,Founder Park 會主動做宣傳。

01并非所有場景都適合構建 Agent(Don't build agents for everything)


Agent 主要用于擴展復雜且有價值的任務,它們成本高、延遲高,不應作為所有用例的直接升級。對于可以清晰映射決策樹的任務,顯式構建工作流(Workflow)更具成本效益和可控性。

何時構建 Agent 的檢查清單:

  1. 任務復雜度 (Complexity):Agent 擅長處理模糊的問題空間。如果決策路徑清晰,應優先選擇工作流。

  2. 任務價值 (Value):Agent 的探索性行為會消耗大量 token,任務的價值必須能證明其成本。對于預算有限(如每任務 10 美分)或高容量(如客服)場景,工作流可能更合適。

  3. 關鍵能力的可行性 (Derisk Critical Capabilities):需確保 Agent 在關鍵環節(如編碼 Agent 的編寫、調試、錯誤恢復能力)不存在嚴重瓶頸,否則會顯著增加成本和延遲。如有瓶頸,應簡化任務范圍。

  4. 錯誤成本與發現難度 (Cost of Error & Error Discovery):如果錯誤代價高昂且難以發現,就很難信任 Agent 自主行動。可以通過限制范圍(如只讀權限、增加人工干預)來緩解,但這也會限制其擴展性。

編碼(Coding)是一個很好的 Agent 用例,因為它任務復雜(從設計文檔到 PR)、價值高、現有模型(如 Claude)在許多環節表現良好,且結果易于驗證(單元測試、CI)。



02保持簡單 (Keep it simple)

Agent 的核心結構:

模型(Model)+ 工具(Tools)+ 循環(Loop)在一個環境(Environment)中運作。

三個關鍵組成部分:
1.環境 (Environment):Agent 操作所在的系統。
2.工具集 (Tools):Agent 采取行動和獲取反饋的接口。
3.系統提示 (System Prompt):定義 Agent 的目標、約束和理想行為。

迭代方法:

優先構建和迭代這三個基本組件,能獲得最高的投資回報率。避免一開始就過度復雜化,這會扼殺迭代速度。優化(如緩存軌跡、并行化工具調用、改進用戶界面以增強信任)應在基本行為確定后再進行。

一致性:

盡管不同 Agent 應用(編碼、搜索、計算機使用)在產品層面、范圍和能力上看起來不同,但它們共享幾乎相同的簡單后端架構。

03像 Agent 一樣思考(Think like your agents)

問題:
開發者常從自身角度出發,難以理解 Agent 為何會犯看似反常的錯誤。

解決方法:
將自己置于 Agent 的“上下文窗口”中。Agent 在每一步的決策都基于有限的上下文信息(如 10k-20k token)。

換位思考練習:
嘗試從 Agent 的視角完成任務,體驗其局限性(例如,只能看到靜態截圖,在推理和工具執行期間如同“閉眼”操作)。這有助于發現 Agent 真正需要哪些信息(如屏幕分辨率、推薦操作、限制條件)以避免不必要的探索。

利用模型自身:
可以直接詢問模型(如 Claude):指令是否模糊?是否理解工具描述?為什么做出某個決策?如何幫助它做出更好的決策?這有助于彌合開發者與 Agent 之間的理解差距。


04個人思考與未來展望

1. 預算感知 Agent (Budget-aware Agents):

需要更好地控制 Agent 的成本和延遲,定義和強制執行時間、金錢、token 預算,以便在生產環境中更廣泛地部署。

2. 自進化工具 (Self-evolving Tools):

Agent 或許能設計和改進自己的工具(元工具),使其更具通用性,能適應不同用例的需求。

3. 多 Agent 協作 (Multi-agent Collaboration):

預計今年年底將在生產中看到更多多 Agent 系統。其優勢包括并行化、關注點分離、保護主 Agent 上下文窗口等。關鍵挑戰在于 Agent 間的通信方式,如何實現異步通信,超越當前的用戶-助手輪流模式。

引用鏈接:

[1]How We Built Effective Agents: Barry Zhang, Anthropic: https://youtu.be/D7_ipDqhtwk?si=atqYQAuvl0xWwrcH


轉載原創文章請添加微信:founderparker

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
嚴月霞陪澳總理爬長城,穿咖色襯衫搭休閑褲,一身便裝更優雅

嚴月霞陪澳總理爬長城,穿咖色襯衫搭休閑褲,一身便裝更優雅

深析古今
2025-07-17 08:01:40
鬧大了!大連工業大學開除女生事件升級,紐約時報中英文均發頭版

鬧大了!大連工業大學開除女生事件升級,紐約時報中英文均發頭版

明月雜談
2025-07-16 06:29:27
陳佩斯《戲臺》首輪口碑出爐,后勁確實大,我卻難忘他的兩次落淚

陳佩斯《戲臺》首輪口碑出爐,后勁確實大,我卻難忘他的兩次落淚

皮皮電影
2025-07-16 20:04:10
特朗普稱可口可樂同意在美國使用蔗糖生產可樂,可口可樂公司回應

特朗普稱可口可樂同意在美國使用蔗糖生產可樂,可口可樂公司回應

環球網資訊
2025-07-17 08:26:40
網友網戀一個月奔現,花千元、見了親戚,房事時摸到男性生殖器

網友網戀一個月奔現,花千元、見了親戚,房事時摸到男性生殖器

社會醬
2025-07-13 17:33:17
宗婕莉信息被扒!曾是學校排球隊主力,不像宗慶后,長得一言難盡

宗婕莉信息被扒!曾是學校排球隊主力,不像宗慶后,長得一言難盡

180視角
2025-07-15 12:03:26
美國人想坐高鐵遙遙無期!特朗普宣布終止資助美國高鐵

美國人想坐高鐵遙遙無期!特朗普宣布終止資助美國高鐵

澎湃新聞
2025-07-17 10:19:17
中醫:性欲與壽命的關系,你一定要知道!

中醫:性欲與壽命的關系,你一定要知道!

華人星光
2025-07-13 22:00:05
在地鐵上“沒掏、沒摸、沒動、沒硬、沒射、沒說話、手舉起來”,就被判強制猥褻罪?

在地鐵上“沒掏、沒摸、沒動、沒硬、沒射、沒說話、手舉起來”,就被判強制猥褻罪?

鄒談
2025-07-17 11:23:11
已確認!是知名演員韓雪

已確認!是知名演員韓雪

wuhu派
2025-07-15 09:21:42
中紀委再劃紅線!公職人員這3種行為要不得,一碰就翻車!

中紀委再劃紅線!公職人員這3種行為要不得,一碰就翻車!

細說職場
2025-07-17 12:39:07
他識破宋江,假裝回鄉探母,結果一去不返,成為水滸結局最好的人

他識破宋江,假裝回鄉探母,結果一去不返,成為水滸結局最好的人

詩意世界
2025-06-01 17:24:35
前隊友巴圖姆:更衣室每看到恩比德的膝蓋,都不知道他如何去走路

前隊友巴圖姆:更衣室每看到恩比德的膝蓋,都不知道他如何去走路

雷速體育
2025-07-17 06:39:46
空調開一整天,需要每天關1小時讓它歇歇嗎?答案太意外了!

空調開一整天,需要每天關1小時讓它歇歇嗎?答案太意外了!

阿傖說事
2025-07-05 11:12:30
29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

青眼財經
2025-07-15 15:56:07
別交易21歲射手?名宿喊話火箭:新射手勝過普里查德,不該打夏聯

別交易21歲射手?名宿喊話火箭:新射手勝過普里查德,不該打夏聯

熊哥愛籃球
2025-07-17 13:44:24
臺灣省徹底亂作一團!巨大爆炸聲,讓民眾驚呼“解放軍進城了”

臺灣省徹底亂作一團!巨大爆炸聲,讓民眾驚呼“解放軍進城了”

南宗歷史
2025-07-16 16:50:26
日媒:日政府向小學分發“兒童版防衛白皮書”,內容被指“敵視中俄”,多個團體要求回收

日媒:日政府向小學分發“兒童版防衛白皮書”,內容被指“敵視中俄”,多個團體要求回收

環球網資訊
2025-07-16 12:08:42
康熙為何會選老四胤禛為繼位人?說來你可能不信,只跟一件事有關

康熙為何會選老四胤禛為繼位人?說來你可能不信,只跟一件事有關

掠影后有感
2025-07-17 10:58:03
3名知情人爆料!宗馥莉為改遺囑發生激烈爭吵,逼爺爺不能改家譜

3名知情人爆料!宗馥莉為改遺囑發生激烈爭吵,逼爺爺不能改家譜

史書無明
2025-07-17 11:36:21
2025-07-17 14:48:49
FounderPark incentive-icons
FounderPark
關注AI創業,專注和創業者聊真問題
846文章數 134關注度
往期回顧 全部

科技要聞

沒有老黃不夸的中國公司了吧??

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

體育要聞

過去一年的頭號贏家,他說偶像永遠是媽媽

娛樂要聞

黃楊鈿甜星途被毀 戴假貨沒人找她代言

財經要聞

宗氏三兄妹在港起訴宗馥莉文書曝光

汽車要聞

8月初上市 長安第三代UNI-V勁擎型嘗鮮價11.49萬

態度原創

游戲
旅游
藝術
本地
公開課

直面會終于來了!寶可夢直面會下周二開啟、皮爺準備要搞事?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宝应县| 石渠县| 吴江市| 洛南县| 葵青区| 南京市| 漳浦县| 灌阳县| 怀宁县| 鱼台县| 彭州市| 屯门区| 平泉县| 米易县| 砚山县| 秭归县| 景东| 卢湾区| 昭苏县| 灌云县| 鸡西市| 屯留县| 原平市| 嘉荫县| 丰都县| 乐至县| 罗定市| 玉树县| 南昌市| 通道| 行唐县| 乌拉特后旗| 三亚市| 扎兰屯市| 仙桃市| 海阳市| 阿拉善右旗| 姚安县| 炎陵县| 青川县| 廉江市|