99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI閉門討論:今天Agent落地的難點在哪里?

0
分享至

之前參加了一場 OpenAI 的活動,主題是管理「自主 AI 系統」(Agentic Systems)。

那時聊了很多有關 Agent 的問題,恰是當下各種 Agent 項目正需面對的。

討論多是基于論文《Practices for Governing Agentic AI Systems》,地址是:https://openai.com/research/practices-for-governing-agentic-ai-systems


明確一下:

OpenAI 會面對這些挑戰,并非是其水平不行,而是更早的開始探索邊界。

-- 大家都將會遇到

Founder Park 正在搭建開發者社群,邀請積極嘗試、測試新模型、新技術的開發者、創業者們加入,請掃碼詳細填寫你的產品/項目信息,通過審核后工作人員會拉你入群~

進群之后,你有機會得到:

  • 高濃度的主流模型(如 DeepSeek 等)開發交流;

  • 資源對接,與 API、云廠商、模型廠商直接交流反饋的機會;

  • 好用、有趣的產品/案例,Founder Park 會主動做宣傳。

01有關 Agent 的定義

Agent 的定義,目前已經嚴重泛化了:兩個人在討論「Agent」,他們討論的可能都不是同一種東西。

按當前的語境,我們會把 ChatGPT 就是看成一種 AI 應用,它能理解你的問題并給出回答。而會把 GPTs 這種訂制后的、能調用外部功能的、能夠自己處理復雜任務的產品,叫做 Agent。

Agent 和 AI 應用(如ChatGPT)之間的區別和聯系主要體現在“代理性”(agenticness)。如果一個AI系統,能夠在沒有直接人類監督的情況下運作,其自主性越高,我們稱之為代理性越強。這是一個連續體,不是非黑即白的判斷,而是根據它在特定環境中的表現來評估其代理性的程度。

在這種定義下,正統 Agent 不僅能回答問題,還能自己決定做什么,它能夠通過生成文本來“思考”,然后做出一些操作,甚至能創造出更多的 AI 幫手來幫幫忙,就比如下面這個圖。(仔細看這個 Twitter 圖,時間是 2 年前


(再補一張2年前, 時任 OpenAI Dev Rel 的 Logan 的發言)


但我們發現,盡管 Agent 看起來很美好,但在實際落地的場景中,也是困難重重,風險多多,出現了問題,責任劃分也很麻煩。比如這里:如果我希望讓某個 Agent 幫我微信收款,但它給別人展示的是付款碼,那么這里誰背鍋?

這些問題,也將會是 o1 在真正行業落地時,所要面對的。

02落地難點

由于會上的 PPT 不便分享,我便在自己吸收后,重新制作了一份 PPT,安心食用

執行效果評估


在商業環境中,確保任何工具的可靠性是基本要求。

然而,AI Agent 的復雜性在于其工作場景和任務的不確定性。例如,一個在模擬環境中表現優異的自動駕駛車輛,可能因現實世界中不可預測的變量(如天氣變化和道路條件)而表現不穩定。

我們尚缺乏有效的方法,來準確評估 AI Agent 在實際環境中的性能。

危險行為界定


AI Agent 在執行高風險操作之前需要獲得用戶的明確批準。例如,在金融領域,AI 執行大額轉賬前必須得到用戶同意。

但需要注意,頻繁的審批請求可能導致用戶出現審批疲勞,從而可能無視風險盲目批準操作,這既削弱了批準機制的效果,也可能增加操作風險。

默認行為確定


當 AI Agent 遇到執行錯誤或不確定的情形時,是要有一個默認行為的。例如,如果一個客服機器人在不確定用戶需求時,其默認行為是請求更多信息以避免錯誤操作。

然而,頻繁的請求可能會影響用戶體驗,因此在保障系統安全性與保持用戶體驗之間需要找到平衡。

推理透明展示


為了保證 AI Agent 決策的透明性,系統需要向用戶清晰展示其推理過程。舉例來說,一個健康咨詢機器人應詳細解釋其提出特定醫療建議的邏輯。

但如果推理過程太復雜,普通用戶可能難以理解,這就需要在確保透明性和易理解性之間找到平衡。

Agent 行為監控


假設一個 AI 系統用于監控倉庫庫存,如果監控系統誤報,誤認為某項商品缺貨,進而不斷的進貨,那么可能導致庫存的嚴重積壓,并造成極大損失。

于是,我們思考:是否需要另一個 Agent 來監控這個 Agent?成本賬怎么算?

Agent 作惡追責


考慮一個匿名發布內容的 AI Agent,如果其發布了違規內容,要追蹤到具體負責的人或機構可能極其困難。這種情況下,建立一個能夠確保責任可追溯的系統尤為關鍵,同時還需要平衡隱私保護和責任追究的需求。

嚴重事故叫停


想象一個用于自動化工廠管理的 AI Agent,在系統檢測到嚴重故障需要立即停機時,不僅需要停止主控系統,還要同步關閉所有從屬設備和流程。如何設計一個能夠迅速且全面響應的緊急停止機制,以防止故障擴散或造成更大損失,是一項技術和策略上的復雜挑戰。

最后

個人來說,希望大家來思考這個問題


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
四川女子遠嫁廣西,曬婆婆做的晚餐,父親看哭了:吃不慣就回來

四川女子遠嫁廣西,曬婆婆做的晚餐,父親看哭了:吃不慣就回來

阿龍美食記
2025-05-28 14:01:24
貝萊德在工商銀行的持股比例于05月23日從5.06%降至4.98%

貝萊德在工商銀行的持股比例于05月23日從5.06%降至4.98%

每日經濟新聞
2025-05-29 17:08:09
戈貝爾兩億肥約今夏結束,下賽季將執行3年1.1億合同

戈貝爾兩億肥約今夏結束,下賽季將執行3年1.1億合同

雷速體育
2025-05-29 14:29:25
價格決戰:3.49萬的小型SUV給你唬住了?

價格決戰:3.49萬的小型SUV給你唬住了?

BigCarShow
2025-05-28 20:16:26
拜仁官宣今夏首援!藥廠3000萬王牌自由身加盟 簽約4年+穿4號球衣

拜仁官宣今夏首援!藥廠3000萬王牌自由身加盟 簽約4年+穿4號球衣

我愛英超
2025-05-29 15:23:30
太難了滕哈赫上任3天塔免簽拜仁,藥廠2.2億三核都將離隊

太難了滕哈赫上任3天塔免簽拜仁,藥廠2.2億三核都將離隊

直播吧
2025-05-29 19:21:13
“端午4不吃,吃了難安康”,端午節將至,哪4不吃?老傳統不能忘

“端午4不吃,吃了難安康”,端午節將至,哪4不吃?老傳統不能忘

愛生活的陶哥
2025-05-29 11:31:24
徐郭平落馬:執掌江蘇國資系統近八年,曾任泰州市市長

徐郭平落馬:執掌江蘇國資系統近八年,曾任泰州市市長

創客公社-江蘇第一創投媒體
2025-05-29 20:30:42
站錯隊是要丟命的

站錯隊是要丟命的

深度報
2025-05-28 23:46:56
王傳福再開一槍,比亞迪被逼還手

王傳福再開一槍,比亞迪被逼還手

象視汽車
2025-05-29 07:00:03
不是病死的,而是治死的?這幾種病不去醫院活得更久?告訴你實情

不是病死的,而是治死的?這幾種病不去醫院活得更久?告訴你實情

牛鍋巴小釩
2025-05-29 13:39:05
二汽總工程師:以為山里建廠隱蔽,其實美國衛星早已拍下大量資料

二汽總工程師:以為山里建廠隱蔽,其實美國衛星早已拍下大量資料

顧史
2025-05-28 15:30:38
CCTV5直播:鄭欽文VS姆博科,中國金花一姐法網強勢爆發

CCTV5直播:鄭欽文VS姆博科,中國金花一姐法網強勢爆發

全能體育柳號
2025-05-29 06:56:21
她們一邊做飯一邊賣淫

她們一邊做飯一邊賣淫

法律讀品
2025-05-05 17:24:28
A股:中國證券報發文!被遺忘的利好突然爆發,明天迎來更大變盤!

A股:中國證券報發文!被遺忘的利好突然爆發,明天迎來更大變盤!

漣漪讀史
2025-05-29 17:48:49
突發!確認墜機

突發!確認墜機

浙江之聲
2025-05-29 15:10:37
黑色搭配灰色顯瘦效果太棒了

黑色搭配灰色顯瘦效果太棒了

美女穿搭分享
2025-05-07 11:01:03
醫院沒有過錯!老杜沒在醫院生

醫院沒有過錯!老杜沒在醫院生

蜻蜓世音
2025-05-29 17:04:53
《教父》柯里昂告訴兒子:人最重要的不是賺多少錢、有多大權勢

《教父》柯里昂告訴兒子:人最重要的不是賺多少錢、有多大權勢

詩詞中國
2025-05-29 13:10:46
張譯官宣退圈!

張譯官宣退圈!

黎兜兜
2025-05-29 21:38:56
2025-05-29 22:12:49
FounderPark incentive-icons
FounderPark
關注AI創業,專注和創業者聊真問題
762文章數 133關注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

疑因2年前的一句"阿姨" 男子遭電話短信騷擾不敢回家

頭條要聞

疑因2年前的一句"阿姨" 男子遭電話短信騷擾不敢回家

體育要聞

納達爾,法網,漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發生了

財經要聞

若對等關稅叫停,特朗普還能怎么加關稅

汽車要聞

換上高爾夫GTI同款2.0T動力 新凌渡L GTS實車曝光

態度原創

本地
家居
手機
健康
公開課

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

家居要聞

暖色復古 溫馨小資情調

手機要聞

全球首款雙2億像素手機被曝光!OPPO要狂卷旗艦機?

唇皰疹和口腔潰瘍是"同伙"嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 托里县| 江西省| 红河县| 滨海县| 万宁市| 牙克石市| 建水县| 塔城市| 鹤壁市| 焉耆| 乌恰县| 阜南县| 美姑县| 女性| 林口县| 望城县| 广汉市| 克拉玛依市| 如皋市| 井陉县| 盐城市| 黄浦区| 宜宾县| 格尔木市| 大港区| 乌拉特前旗| 亳州市| 上饶县| 漯河市| 全椒县| 新干县| 磐安县| 长岭县| 松原市| 高雄市| 康马县| 苍溪县| 石首市| 井冈山市| 兴隆县| 博乐市|