99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Manus刷屏了一天,再來聽聽OpenAI如何從0到1搭建AI Agent的經驗分享(附視頻)

0
分享至

(關注公眾號設為標,獲取AI深度洞察)

全文 4,000字 | 閱讀約16分鐘




自3月6日凌晨,Manus的AI產品突然在各大社交媒體刷屏。這個被稱為"全球第一款通用Agent產品"的工具一經推出就引發熱議,邀請碼甚至被炒到了5萬元一個。

在這股AI Agent熱潮中,值得關注的還有行業巨頭OpenAI的專家們對AI Agent開發的思考。"2025年將成為AI Agent之年,這一年人工智能將真正從助手角色畢業,成為真正的協作伙伴。"OpenAI解決方案架構團隊負責人Toki Sherbakov在近期的紐約AI工程師峰會上如此預測。

而對于如何構建有效的AI Agent,OpenAI的解決方案架構師Prashant Mital則提出了令人深思的觀點:"團隊經常直接跳入設計多AI agent系統,AI agent調用AI agent,動態協調任務,處理長對話。這一切聽起來很強大,但當過早進行時,它會創造很多未知因素。我們建議從為單一任務專門構建的單一AI agent開始,將其投入使用,限定用戶群體,并觀察其表現。"

這種從0到1、從簡單到復雜的方法論,與當下很多企業急于求成的做法形成鮮明對比。那么,OpenAI專家們是如何一步步構建企業級AI Agent的?他們積累了哪些可復制的經驗?以下是他們分享的核心內容:

Toki Sherbakov的演講

如何利用OpenAI構建和擴展應用場景,這對企業與OpenAI合作將應用方案推向實際使用環境意味著什么,并簡要介紹AI agent以及我們在構建這些應用方案和智能工作流程方面的實踐經驗。

OpenAI的組織架構

首先簡單介紹一下OpenAI的組織架構。相信大家已經聽說過OpenAI,但就運作方式而言,我們有兩個核心技術團隊。一是研究團隊,由1,200名研究人員組成,他們負責創造這些人工智能模型,開發和部署這些基礎模型,可以說這些模型是"從天而降"的。二是應用團隊,我們的第二個技術團隊,他們將這些模型轉化為產品,這就是您看到的ChatGPT和API等產品的來源。

在市場推廣方面,我們的團隊將這些產品實際部署到用戶手中,幫助將這些技術應用到您的員工隊伍和產品中,真正開始自動化內部工作。一旦部署完成,我們會形成一個不斷改進的循環,從實際使用中獲取反饋來直接改進產品,并通過這個研究循環來改進我們的核心模型。這就是OpenAI的典型運作方式。

企業AI agent場景

在企業中,我們觀察到AI客戶使用旅程通常分為三個階段,雖然不一定按這個順序發展,但這是我們通常看到的模式。首先是建立能使用AI的員工隊伍,將AI技術交到員工手中,讓他們了解AI知識,在日常工作中使用AI。接著通常發展到自動化AI運營,這更多用于內部場景,為員工隊伍構建自動化或輔助工作的應用。最后一步是將AI融入面向最終用戶的產品中。

就OpenAI的具體產品而言,啟用員工隊伍通常始于ChatGPT,這是我們的主打產品,供用戶日常使用。當涉及內部自動化運營時,可以部分使用ChatGPT,但對于更復雜的場景或需要更多個性化的情況,則需要使用API。最后,將AI融入終端用戶產品主要是API應用。

企業在實踐中制定AI戰略通常從高層確定策略應該是什么。我們認識到,重要的不是"什么是你的AI戰略",而是"什么是您更廣泛的業務戰略",OpenAI的作用是幫助確定技術如何滿足這一更廣泛的業務戰略。有了高層的指導后,就可以確定一兩個重要的應用場景開始,并規劃這些場景,確實地實現。一旦有了戰略并執行了一兩個應用場景,就需要考慮如何在整個企業中建立部門能力。這包括通過培訓員工、建立專業中心,或者建立一個集中化的技術平臺,讓企業內的其他人可以在此基礎上進行開發。

以一個三個月的應用場景開發為例,當確定了要首先解決的場景后,首先要進行初步范圍界定,技術架構評估,以了解AI如何融入當前的技術環境,并明確定義成功指標和關鍵性能指標。接著是開發階段,這是花費最多時間的部分,在這里進行不斷嘗試,改進提示策略、智能檢索等,以不斷改進正在處理的方案。這是我們團隊與您的技術團隊通過研討會、辦公時間、共同編程會議、網絡講座等方式密切互動的地方。然后是測試和評估階段,使用預先定義的評估標準進行對比測試和小范圍推出,了解實際效果。最后是正式使用階段,進行啟動推出,進行規模優化測試,以確保在推廣給多個用戶時能夠正常工作,然后進行持續維護。

摩根士丹利案例

在與OpenAI合作過程中,我們提供專門的團隊,也要求你提供專門的團隊來使這一過程順利進行。我們提供的支持包括提前使用新模型和功能的權限,來自我們研究、技術和產品團隊的內部專家支持,以及聯合發展規劃會議,確保我們與您的未來發展方向保持一致。

以摩根士丹利為例,他們建立了一個內部知識助手,讓他們的財富管理員能夠查詢大量知識庫,并獲得高度準確的信息來回應客戶。最初,準確率只有45%。在與我們互動過程中,我們引入了新方法,如高級檢索技術、個性化調整、不同的信息分塊策略,這些改進了性能。隨著我們不斷引入更多方法,準確率不斷提高。我們引入了重新排序和分類步驟,使準確率達到了85%。最終,他們的目標是90%,但我們通過其他方法如提示優化和查詢擴展,實現了98%的準確率。

2025:AI agent之年

展望未來,我們越來越多地看到的是在AI agent領域的開發。可能你聽說過"2025年是AI agent之年",智能工作流程一直是一個熱門話題,但我認為今年我們將看到它真正變為現實。

Prashant Mital的演講

OpenAI,我們有幸與正在構建最先進AI agent的客戶并肩工作,同時也與開發我們自己的智能產品(如Deep Research和Operator)的團隊成員密切合作。正如Toki所說,我們預計2025年將成為AI agent之年,這一年人工智能將真正從簡單的助手角色畢業,成為真正的協作伙伴。為了迎接這個時代的到來,我們一直在努力找出AI agent開發中常見的成功模式和需要避免的問題。今天我很高興與大家分享其中的四個要點。

AI agent的定義

在進一步討論之前,我想先解釋一下我們所說的"AI agent"。我們認為AI agent是一種人工智能應用,它由一個模型組成,這個模型有一些指令(通常以提示的形式出現),能夠獲取信息和與外部系統互動的工具,所有這些都在一個運行循環中,而這個循環的結束由模型自身控制。 可以這樣理解:在每個運行周期中,AI agent可以被視為一個接收自然語言指令、決定是否使用工具、運行這些工具、整合工具返回的結果,然后向用戶提供答案的實體。此外,AI agent可能會判斷它已經完成了任務,因此結束運行循環。

構建AI agent的經驗 教訓一:簡化工具而非依賴

想象一下,你正在設計一個AI agent,需要協調多個模型,獲取數據,分析并生成輸出。你有兩個選擇:可以從基礎部分開始,進行直接的程序調用,自己記錄結果和輸出及失敗;或者可以從現成的框架開始,選擇一個集成方案,連接起來,讓它處理許多細節。不得不說,從現成框架開始是很有吸引力的,這也是我開始構建AI agent的方式。這樣很容易上手,很快就能建立一個初步演示。但問題是,如果你直接從框架開始,你往往不知道你的系統如何運行或它使用什么基礎部分。在你理解限制條件之前,你就已經推遲了設計決策,而如果你不知道限制條件,你就無法優化解決方案。

我們認為更好的方法是:首先使用基礎部分構建,了解你的任務如何細分,失敗在哪里發生,以及什么實際需要改進。然后,當你發現自己在重復造輪子時,這可能是引入一些集成方案的好時機。現在很多團隊花費大量時間選擇正確的框架,但我們認為,以可擴展方式開發AI agent并不是選擇正確集成方案的問題,而是了解你的數據、失敗點和限制條件的問題。

教訓二:從簡單開始

團隊經常直接跳入設計多AI agent系統,AI agent調用AI agent,動態協調任務,處理長對話。這一切聽起來很強大,但當過早進行時,它會創造很多未知因素,而不會給你提供太多啟示。我們喜歡一種不同的方法:我們通常建議從為單一任務專門構建的單一AI agent開始,將其投入使用,限定用戶群體,并觀察其表現。這樣做可以讓你識別真正的問題:錯誤回答、對話過長、因反應慢導致的低使用率,或者由于信息獲取不佳導致的不準確。

然后,了解系統表現不佳的地方以及對用戶重要的因素,我們可以逐步改進它。簡而言之,我們應該將復雜性視為隨著我們發現更多明顯的失敗案例和限制而增加的東西,因為目標并不是構建一個復雜的系統,而是構建一個有效的系統。

教訓三:AI agent處理復雜任務

從簡單開始聽起來很好,但我們都知道,真正的價值在復雜中實現。那么,我們應該如何處理更復雜的任務呢?這就是AI agent網絡和交接概念的用武之地。 AI agent網絡是一個協作系統,多個AI agent一起工作,以解決復雜請求或執行一系列相互關聯的任務。你可以將其視為一系列專門的AI agent,處理大型智能工作流程中的子流程。

關于交接,你可以將其視為一個AI agent將正在進行的對話的控制權轉移給另一個AI agent的過程。這與電話中轉接到其他人很相似,只不過在這種情況下,你可以保留整個對話歷史,新AI agent就像魔術一樣已經知道你之前談過的所有內容。在示例架構中,我們展示了如何使用AI agent網絡和交接實現全自動客戶服務流程。這種方法允許我們將合適的工具用于合適的工作。例如,我們使用一種模型對傳入請求進行分類,然后使用另一種模型與用戶管理對話,最后使用第三種模型執行需要高準確性的任務,如檢查客戶是否有資格獲得退款。 事實證明,交接非常有效,保持整個對話歷史和上下文,同時切換模型、指令、工具定義,提供了足夠的靈活性來解決廣泛的場景。

教訓四:保持指令簡單

我們的最后一個教訓涉及安全措施。安全措施是對應用程序中確保安全性和可靠性的任何機制的總稱,通常用于防止濫用并確保系統保持正常運行。 保持模型指令簡單并專注于目標任務,確保系統的最大通用性,并確保我們能夠以最可預測的方式提高準確性和性能。安全措施不一定要成為你主要指令的一部分,而應該并行運行,更快更便宜的模型的普及使這一點比以往任何時候都更容易實現。

高風險的工具使用和用戶回應(例如,發出退款或向用戶顯示其個人賬戶中的信息)可以推遲,直到所有安全措施都已確認通過。在這個例子中,我們看到我們運行了一個輸入安全檢查來防止惡意指令,然后在AI agent的回應上運行了幾個輸出安全檢查。

總結

回顧一下,我們從構建AI agent的經驗中總結出四個教訓:

  • 最小化使用集成工具

  • 從單一AI agent開始

  • 當你面臨更復雜的情況時,升級到AI agent網絡

  • 保持指令簡單,專注于常規情況,使用安全措施處理特殊情況

星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

原文鏈接:https://www.youtube.com/watch?v=joHR2pmxDQE&t=377s&ab_channel=AIEngineer

來源:官方媒體/網絡新聞

排版:Atlas

編輯:深思

主編:圖靈

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美媒:中美可能很快就會開戰,中國導彈雨能穿透美軍所有防御

美媒:中美可能很快就會開戰,中國導彈雨能穿透美軍所有防御

文史旺旺旺
2025-05-28 21:30:13
大反轉!孫繼海18萬事件真曝光:想要自由身份證明,踢校園足球。

大反轉!孫繼海18萬事件真曝光:想要自由身份證明,踢校園足球。

清游說娛
2025-05-28 10:14:25
國米第3第4簽啟動,5000萬巨資,欲拿下小盧卡庫、維爾馬倫接班人

國米第3第4簽啟動,5000萬巨資,欲拿下小盧卡庫、維爾馬倫接班人

體育全天候
2025-05-29 22:06:33
比亞迪降價原因沒那么簡單!符合新國標車型或上市在即 但庫存壓力凸顯存貨已達1544億

比亞迪降價原因沒那么簡單!符合新國標車型或上市在即 但庫存壓力凸顯存貨已達1544億

挖貝網
2025-05-28 20:22:19
全是唏噓!《折腰》36集大結局:大喬自盡,魏梁戰死,蘇娥皇殉情

全是唏噓!《折腰》36集大結局:大喬自盡,魏梁戰死,蘇娥皇殉情

頭號劇委會
2025-05-30 01:15:03
別拿生命去發生性關系

別拿生命去發生性關系

難得君
2025-05-27 13:58:03
排名世界第1后再未奪冠!林詩棟連續6次無緣金牌,世乒賽顆粒無收

排名世界第1后再未奪冠!林詩棟連續6次無緣金牌,世乒賽顆粒無收

全言作品
2025-05-30 01:14:44
母親過度溺愛兒子,洗澡時兒子突然情緒激動:媽媽我要你永遠愛我

母親過度溺愛兒子,洗澡時兒子突然情緒激動:媽媽我要你永遠愛我

罪案洞察者
2025-04-11 09:20:55
出差住亞朵,已經成了職場潛規則

出差住亞朵,已經成了職場潛規則

B面人物
2025-05-14 12:38:58
昆明市檢察長任上被查,中央提級巡視,昆明已有6官員被查

昆明市檢察長任上被查,中央提級巡視,昆明已有6官員被查

南方都市報
2025-05-29 14:12:08
俄羅斯盧布兌美元升破79,創2023年6月以來的最高水平

俄羅斯盧布兌美元升破79,創2023年6月以來的最高水平

每日經濟新聞
2025-05-29 16:20:07
上海一區重磅政策細則!今年推8000套低價房,月租不超2000元,還能白住7天...這樣申請→

上海一區重磅政策細則!今年推8000套低價房,月租不超2000元,還能白住7天...這樣申請→

上觀新聞
2025-05-28 19:06:49
國米將在圣西羅球場安裝大屏幕現場播放歐冠決賽,門票10歐元起

國米將在圣西羅球場安裝大屏幕現場播放歐冠決賽,門票10歐元起

直播吧
2025-05-29 23:25:10
劉亦菲新LV廣告,馬甲線和草編包完美結合,網友:太絕了!

劉亦菲新LV廣告,馬甲線和草編包完美結合,網友:太絕了!

世界探索發現
2025-05-29 19:16:16
如今的不知火舞雕像太良心了,內部設施一應俱全

如今的不知火舞雕像太良心了,內部設施一應俱全

街機時代
2025-05-29 18:45:03
美國警告:中國若與俄羅斯交易將面臨嚴厲制裁

美國警告:中國若與俄羅斯交易將面臨嚴厲制裁

陳穟侃故事
2025-05-28 17:26:13
美國萬萬沒想到,中國秘密進行一個耗資664億、歷時十余年的工程

美國萬萬沒想到,中國秘密進行一個耗資664億、歷時十余年的工程

南權先生
2025-05-28 16:12:25
臭名遠揚的4位老藝術家,貪財好色、崇洋媚外、改國籍,誰最可恨

臭名遠揚的4位老藝術家,貪財好色、崇洋媚外、改國籍,誰最可恨

清游說娛
2025-04-07 12:56:41
22分鐘傷退!阿爾巴無對抗下受傷倒地,被替換下場

22分鐘傷退!阿爾巴無對抗下受傷倒地,被替換下場

直播吧
2025-05-29 08:13:16
“零公里二手車”在醞釀危險風暴

“零公里二手車”在醞釀危險風暴

今綸財經
2025-05-28 19:22:55
2025-05-30 03:19:00
AI深度研究員 incentive-icons
AI深度研究員
一個專注于人工智能(AI)前沿技術、理論研究和實際應用的自媒體
182文章數 132關注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

體育要聞

納達爾,法網,漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發生了

財經要聞

若對等關稅叫停,特朗普還能怎么加關稅

汽車要聞

首搭鴻蒙座艙5 嵐圖FREE+將于6月預售

態度原創

親子
教育
時尚
本地
公開課

親子要聞

那個被截肢的1歲寶寶,本可以避免這場悲劇

教育要聞

題目的意思很簡單,但是做起來比較難

這些才是適合夏天的打扮!色彩不沉悶、適當露膚,輕盈又舒適

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 株洲县| 绍兴市| 兰坪| 苍梧县| 怀仁县| 米易县| 嘉鱼县| 公安县| 京山县| 齐齐哈尔市| 禄丰县| 通化县| 汕尾市| 宝山区| 台江县| 皋兰县| 旌德县| 老河口市| 鄂托克旗| 全南县| 遵义县| 西乌| 维西| 武威市| 南开区| 横峰县| 樟树市| 涡阳县| 张家港市| 舞阳县| 渝中区| 融水| 青阳县| 交城县| 崇礼县| 玉龙| 马龙县| 东兴市| 崇明县| 东辽县| 屏东县|