99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

推薦閱讀:總是寫不好AI提示詞?2025年,智能Agent將自動理解你的真實需求

0
分享至

(關(guān)注公眾號設(shè)為標,獲取AI深度洞察)

全文 2,000字 | 閱讀約8分鐘



你是不是經(jīng)常對著AI助手絞盡腦汁,卻總是得不到想要的結(jié)果?別擔心,這個困擾即將成為歷史。2025年初,AI領(lǐng)域悄然發(fā)生了一場革命,卻幾乎無人察覺。

2025年1月,OpenAI發(fā)布了名為DeepResearch的O3模型變種,專門用于網(wǎng)頁和文檔搜索。這不是普通的更新,而是AI交互方式的根本變革。這個模型經(jīng)過特殊訓練,能像人類一樣聰明地搜索信息:它會自主制定搜索計劃,對比不同信息來源,甚至能根據(jù)搜索結(jié)果調(diào)整自己的策略,而這一切都不需要你掌握任何特殊的提示詞技巧。

正如AI研究員William Brown所說:"現(xiàn)在的LLM Agent已經(jīng)能完成需要多個步驟和較長時間的任務(wù)了,而且理解用戶需求的能力大幅提升。"

這些進展讓我們需要重新思考:什么才算是真正的LLM Agent?去年12月,Anthropic給出了一個新定義:真正的LLM Agent應該能自己決定怎么完成任務(wù)、何時使用什么工具,就像一個有自主性的助手。

而目前大多數(shù)所謂的Agent實際上只是按照預設(shè)規(guī)則運行的工作流系統(tǒng)。它們只是按照人類事先寫好的指令和規(guī)則來協(xié)調(diào)AI模型和各種工具。比如最近很火的Manus AI,我親自測試后發(fā)現(xiàn)它仍有明顯問題:

  • 不能有效計劃任務(wù),常常卡在中途不知道下一步怎么做

  • 記不住之前的內(nèi)容,無法處理超過幾分鐘的任務(wù)

  • 做長任務(wù)時容易出錯,一連串小錯誤最終導致整個任務(wù)失敗

所以,這篇文章想給大家提供一個更清晰的"LLM Agent"定義,結(jié)合公開信息和我的一些想法,用簡單的方式解釋這些AI助手到底是什么,以及它們將如何改變我們的日常生活。"

一、LLM Agent的「苦澀教訓」

傳統(tǒng)的Agent和基礎(chǔ)大語言模型(base LLM)完全不同。

想象一下傳統(tǒng)的Agent就像是在迷宮中學習走路的小機器人。這個小機器人一開始什么都不懂,但通過不斷嘗試,它會記住哪條路能走通,哪條路是死胡同,慢慢找到最快到達終點的路徑。專業(yè)上,這叫「強化學習」和「搜索」,有點像我們在網(wǎng)上點擊各種鏈接尋找信息的過程。去年很火的OpenAI Q-star算法,據(jù)說就是從1968年一個著名的搜索算法改進而來的。

但大語言模型(LLM)的工作方式卻截然不同:

  • 傳統(tǒng)Agent能記住之前的經(jīng)驗,而基礎(chǔ)LLM只能看到當前對話中的內(nèi)容,就像金魚記憶一樣短暫;

  • 傳統(tǒng)Agent受物理世界限制,而基礎(chǔ)LLM只是預測"下一個詞應該是什么",容易天馬行空不著邊際;

  • 傳統(tǒng)Agent能規(guī)劃長期策略,而基礎(chǔ)LLM只擅長簡單推理,面對復雜任務(wù)就容易"糊涂"

現(xiàn)在,大多數(shù)"LLM Agent"都是靠預先寫好的提示詞和規(guī)則來引導模型工作。這種方法卻面臨一個被稱為"苦澀教訓"的問題:這就像是老師把所有答案都硬塞給學生,短期內(nèi)學生考試成績很好,但長遠來看,學生并沒有真正學會獨立思考。真正的突破應該來自系統(tǒng)自己學習和探索的能力提升,而不是人為增加更多規(guī)則。

這就是為什么像Manus AI這樣的系統(tǒng)在訂機票或復雜任務(wù)上表現(xiàn)不佳——它們只是按規(guī)則行事,沒有真正的理解和適應能力。要想取得真正的進步,我們需要從根本上設(shè)計能夠像人類一樣思考、規(guī)劃和行動的系統(tǒng),而不僅僅是依靠預設(shè)的指令。

二、RL+推理:LLM Agent的制勝秘訣

那么,真正厲害的LLM Agent到底應該是什么樣子呢?雖然官方?jīng)]透露太多信息,但從現(xiàn)有研究中,我們可以發(fā)現(xiàn)它們有這些共同特點:

  • 1、強化學習:想象一個孩子學騎自行車:跌倒了(錯誤)就記住這樣不行,成功了(獎勵)就記住這個方法。LLM Agent的訓練也是這樣,設(shè)定一個目標,讓它通過不斷嘗試和犯錯來學習最佳方法。

  • 2、草稿模式:不是一個字一個字地訓練,而是讓AI先寫出一整段內(nèi)容(就像我們寫草稿),然后再整體評價好壞,這樣AI能學會更連貫的思考方式。

  • 3、結(jié)構(gòu)化輸出:就像填表格一樣,AI必須按照特定格式輸出結(jié)果,這樣更容易判斷對錯,也更容易給予明確的反饋。

  • 4、多步訓練:不是一次性完成訓練,而是分多個階段。比如在搜索任務(wù)中,AI會學習如何制定計劃、如何根據(jù)結(jié)果調(diào)整計劃、如何回頭檢查等等,就像人類解決復雜問題的過程。

好消息是,這些技術(shù)已經(jīng)變得越來越高效,不需要超級昂貴的計算資源就能實現(xiàn)。這意味著未來這樣的智能AI助手會越來越普及,真正走入我們的日常生活。

三、等等,這東西能大規(guī)模制造嗎?

但要真正做出像DeepResearch這樣厲害的搜索Agent,還有一個大難題:我們?nèi)鄙儆柧殧?shù)據(jù)!

想想看,要教會AI像人類一樣聰明地搜索信息,理想情況下應該有大量"人類是如何搜索的"數(shù)據(jù)。比如你在搜索引擎上尋找信息時,點擊了哪些鏈接,怎么組織搜索詞等。但這些數(shù)據(jù)大多掌握在谷歌這樣的大公司手中,外人幾乎拿不到。 現(xiàn)在的解決方案是:創(chuàng)造虛擬數(shù)據(jù)。具體來說,就是搭建一個"迷你互聯(lián)網(wǎng)"模擬環(huán)境,讓AI在這個環(huán)境中反復練習搜索,就像游戲角色在虛擬世界中練級一樣。雖然這個過程需要龐大的計算資源,但通過一些技術(shù)手段可以降低成本。

OpenAI和Anthropic這樣的公司可能正在用這種方法訓練他們的搜索Agent:

  • 首先,創(chuàng)建一個虛擬的網(wǎng)絡(luò)環(huán)境,讓AI在里面自由搜索

  • 接著,給AI一些基礎(chǔ)訓練,就像教小孩基本規(guī)則

  • 然后,讓AI通過不斷嘗試來提升搜索技巧

  • 最后,教會AI如何把找到的信息整理成有用的回答

這樣訓練出來的AI才能真正理解人類的搜索需求,提供更智能的幫助。

四、真正的LLM Agent,根本不需要提示詞

當真正的LLM Agent出現(xiàn)后,它將和現(xiàn)在那些需要你學習特定指令的AI系統(tǒng)完全不同。正如Anthropic的定義所說:

LLM Agent能自己決定怎么做事,用什么工具,完全不需要人手把手教。

拿搜索任務(wù)來舉個例子:

  • 它會自動理解你想找什么,如果聽不懂就會直接問你

  • 它會自己判斷應該去哪找信息,不需要你指定

  • 它能夠規(guī)劃整個搜索過程,如果走錯路還會自己調(diào)整方向

  • 整個過程都會記錄下來,讓你明白它是怎么工作的,增加信任感

這種先進的Agent可以直接使用現(xiàn)有的搜索工具,你完全不需要學習什么"提示詞技巧"或"特殊指令"。

這種技術(shù)同樣可以用在金融、網(wǎng)絡(luò)管理等許多領(lǐng)域:未來,真正的AI Agent不再只是一個花哨的聊天機器人,而是能真正理解你需要什么、主動幫你完成任務(wù)的智能助手,就像有一個真人助理一樣方便

五、2025:Agent元年?

現(xiàn)在,只有少數(shù)幾家科技巨頭有資源和技術(shù)能力開發(fā)出真正的LLM Agent。雖然短期內(nèi)這些強大的AI助手可能還是大公司的專利,但從長遠看,這種技術(shù)終將普及。

我們不想夸大任何技術(shù)的影響,但這種能自主思考和行動的LLM Agent的潛力確實令人震撼。2025年會是這些智能AI助手真正走進日常生活的一年嗎?答案取決于整個行業(yè)的努力與創(chuàng)新。

正如著名英國科幻小說家阿瑟·克拉克所說:'任何足夠先進的技術(shù)都與魔法無異。'而真正的LLM Agent,很可能就是我們這個時代最接近'魔法'的技術(shù)突破。"

星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設(shè)為星標" ← AI深度研究員 ? ← 設(shè)為星標

參考資料:https://vintagedata.org/blog/posts/designing-llm-agents

來源:官方媒體/網(wǎng)絡(luò)新聞

排版:Atlas

編輯:深思

主編: 圖靈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
地下捐精有多亂:女子被約到賓館,捐精者:直接發(fā)生關(guān)系只收800

地下捐精有多亂:女子被約到賓館,捐精者:直接發(fā)生關(guān)系只收800

就一點
2025-02-06 10:35:13
3863 萬、東莞市公安局視頻云大單

3863 萬、東莞市公安局視頻云大單

云頭條
2025-05-29 22:41:10
屬蛇聰明,屬猴精明,十二生肖智商排行榜,太準了!

屬蛇聰明,屬猴精明,十二生肖智商排行榜,太準了!

大禹小城
2025-05-27 21:04:12
院長亂搞關(guān)系,被抓落馬,竟連累副縣長!

院長亂搞關(guān)系,被抓落馬,竟連累副縣長!

霧島夜話
2025-05-24 16:13:37
庫存350?萬輛壓頂?價格戰(zhàn)還能打多久?

庫存350?萬輛壓頂?價格戰(zhàn)還能打多久?

51qc我要汽車網(wǎng)
2025-05-28 17:03:03
楊梅堆成山卻賣不動,70元一斤誰敢買?果農(nóng):今年可能又爛在樹上

楊梅堆成山卻賣不動,70元一斤誰敢買?果農(nóng):今年可能又爛在樹上

阿傖說事
2025-05-26 15:08:02
年薪2250萬歐!西媒:皇馬考慮支付500萬歐,提前1年解約阿拉巴

年薪2250萬歐!西媒:皇馬考慮支付500萬歐,提前1年解約阿拉巴

直播吧
2025-05-29 22:32:08
叔叔去世,堂哥讓堂妹回去奔喪,媽媽也強烈要求!網(wǎng)友竟然問為啥

叔叔去世,堂哥讓堂妹回去奔喪,媽媽也強烈要求!網(wǎng)友竟然問為啥

火山詩話
2025-05-28 19:28:52
35歲香港知名女星林芊妤宣布懷孕!寶寶染色體出問題可能導致引產(chǎn)

35歲香港知名女星林芊妤宣布懷孕!寶寶染色體出問題可能導致引產(chǎn)

魯中晨報
2025-05-29 14:41:08
鹿晗追星成功,曬與日本男星山下智久合照

鹿晗追星成功,曬與日本男星山下智久合照

極目新聞
2025-05-29 15:04:09
斷了,全斷了,打工人到底能捅多大的簍子?

斷了,全斷了,打工人到底能捅多大的簍子?

中國先進制造技術(shù)論壇
2025-05-28 17:38:04
真不敢相信照片中的這個女人,竟然是著名主持人朱迅!

真不敢相信照片中的這個女人,竟然是著名主持人朱迅!

草莓解說體育
2025-05-29 14:00:51
笑死在郝蕾評論區(qū)了

笑死在郝蕾評論區(qū)了

史行途
2025-05-27 16:10:33
朱珠懷二胎了?買新生兒衣服偶遇,近期路透孕味明顯!

朱珠懷二胎了?買新生兒衣服偶遇,近期路透孕味明顯!

古希臘掌管月桂的神
2025-05-29 20:21:43
喬-約翰遜:我拒絕了太陽4500萬報價 最終老鷹給我7000萬的合同

喬-約翰遜:我拒絕了太陽4500萬報價 最終老鷹給我7000萬的合同

直播吧
2025-05-30 00:39:10
美國對中國留學生下手,27萬留美學生一夜之間……

美國對中國留學生下手,27萬留美學生一夜之間……

販財局
2025-05-29 14:55:12
憑實力奪來冠軍,怎么就尷尬了?藍軍的歐戰(zhàn)大滿貫,皇馬真做不到

憑實力奪來冠軍,怎么就尷尬了?藍軍的歐戰(zhàn)大滿貫,皇馬真做不到

濤哥侃球
2025-05-29 20:43:32
卡魯索:我們有5-6人能夠入選最佳防陣 統(tǒng)一戰(zhàn)線的我們很可怕

卡魯索:我們有5-6人能夠入選最佳防陣 統(tǒng)一戰(zhàn)線的我們很可怕

直播吧
2025-05-30 00:18:09
中組部決定:王志偉任國家電網(wǎng)副總經(jīng)理

中組部決定:王志偉任國家電網(wǎng)副總經(jīng)理

極目新聞
2025-05-29 23:08:24
打敗皮鞋的,并不是另一雙皮鞋!皮鞋,正在被時代拋棄

打敗皮鞋的,并不是另一雙皮鞋!皮鞋,正在被時代拋棄

阿綏談史
2025-05-14 15:09:29
2025-05-30 03:04:49
AI深度研究員 incentive-icons
AI深度研究員
一個專注于人工智能(AI)前沿技術(shù)、理論研究和實際應用的自媒體
182文章數(shù) 132關(guān)注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

體育要聞

納達爾,法網(wǎng),漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發(fā)生了

財經(jīng)要聞

若對等關(guān)稅叫停,特朗普還能怎么加關(guān)稅

汽車要聞

首搭鴻蒙座艙5 嵐圖FREE+將于6月預售

態(tài)度原創(chuàng)

數(shù)碼
健康
時尚
藝術(shù)
房產(chǎn)

數(shù)碼要聞

英偉達原生 GeForce NOW 應用登陸 Steam Deck

唇皰疹和口腔潰瘍是"同伙"嗎?

這些才是適合夏天的打扮!色彩不沉悶、適當露膚,輕盈又舒適

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產(chǎn)要聞

清盤倒計時!這個天河芯紅盤,贏的不止多一點!

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 吉木乃县| 土默特左旗| 栾川县| 额济纳旗| 郑州市| 巴中市| 铁力市| 洱源县| 沅江市| 西吉县| 凌源市| 同心县| 河北省| 临邑县| 独山县| 香港| 龙里县| 斗六市| 运城市| 枝江市| 武隆县| 正宁县| 托里县| 旅游| 宁晋县| 乐都县| 维西| 视频| 密云县| 拜泉县| 禹城市| 新昌县| 临沂市| 平陆县| 富宁县| 永宁县| 砚山县| 松阳县| 宁陵县| 拉萨市| 石城县|