99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

「上下文工程」硅谷爆火,Karpathy親自站臺!提示工程瞬間失寵

0
分享至


新智元報道

編輯:桃子

【新智元導(dǎo)讀】繼提示工程之后,「上下文工程」又紅了!這一概念深得Karpathy等硅谷大佬的喜歡,堪稱「全新的氛圍編程」。而智能體成敗的關(guān)鍵,不在于精湛的代碼,而是上下文工程。

硅谷如今炙手可熱的,不再是提示詞工程,而是上下文工程(Context Engineering)!

就連AI大神Karpathy,都為「上下文工程」投下了一票。


還有Shopify CEO Tobias Lütke稱,自己更喜歡「上下文工程」,因其準確描述了一個核心技能——

通過為任務(wù)提供完整的背景信息,讓大模型能夠合理解決問題的藝術(shù)。


一夜之間,「上下文工程」紅遍全網(wǎng),究竟是為什么?


上下文工程,一夜爆紅

這背后原因,離不開AI智能體的興起。

OpenAI總裁Greg Brockman多次公開表示,「2025年,是AI智能體的元年」。


決定智能體成功或失敗最關(guān)鍵的因素,是提供的「上下文質(zhì)量」。也就是說,加載到「有限工作記憶」中的信息愈加重要。

大多數(shù)AI智能體失敗的案例,不是模型的失敗,而是上下文的失敗!

那么,什么是上下文?


要理解「上下文工程」,首先需要擴展「上下文」的定義。

它不僅僅是你發(fā)送給LLM的單一提示,可以將其視為「模型再生成響應(yīng)之前,看到的所有內(nèi)容」,如下:

  • 指令/系統(tǒng)提示:定義模型在對話中行為的初始指令集,可以/應(yīng)該包括示例、規(guī)則等。

  • 用戶提示:用戶的即時任務(wù)或問題。

  • 狀態(tài)/歷史(短期記憶):當(dāng)前對話,包括用戶和模型的響應(yīng),截至此刻。

  • 長期記憶:跨多次之前對話收集的持久知識庫,包含學(xué)習(xí)到的用戶偏好、過去項目的摘要或要求記住以備將來使用的事實。

  • 檢索信息(RAG):外部、實時的知識,來自文檔、數(shù)據(jù)庫或API的相關(guān)信息,用于回答特定問題。

  • 可用工具:模型可以調(diào)用的所有功能或內(nèi)置工具的定義,比如check_inventory、send_email。

  • 結(jié)構(gòu)化輸出:模型響應(yīng)格式的定義,例如JSON對象。

可以看出,與專注于在單一本文字符串中,精心構(gòu)建完美指令的「提示詞工程」不同,「上下文工程」的范疇要廣泛得多。


簡單來說:

「上下文工程」是一門學(xué)科,它致力于設(shè)計和構(gòu)建動態(tài)系統(tǒng)。

這些系統(tǒng)能夠在恰當(dāng)?shù)臅r機、以恰當(dāng)?shù)母袷剑峁┣‘?dāng)?shù)男畔⒑凸ぞ撸瑥亩孡LM擁有完成任務(wù)所需的一切。

以下是「上下文工程」的所有特點

· 它是一個系統(tǒng),而非一個字符串:上下文并非一個靜態(tài)的提示詞模板,而是一個系統(tǒng)的輸出,這個系統(tǒng)在對LLM進行主調(diào)用之前就已經(jīng)運行。

· 它是動態(tài)的:上下文是即時生成的,為當(dāng)前任務(wù)量身定制。比如,某個請求可能需要的是日歷數(shù)據(jù),而另一個請求則可能需要電子郵件內(nèi)容或網(wǎng)絡(luò)搜索結(jié)果。

· 它強調(diào)在恰當(dāng)時機提供恰當(dāng)信息與工具:其核心任務(wù)是確保模型不會遺漏關(guān)鍵細節(jié)(謹記「垃圾進,垃圾出」原則)。這意味著只在必要且有益的情況下,才向模型提供知識(信息)和能力(工具)。

· 它注重格式:信息的呈現(xiàn)方式至關(guān)重要。一份簡潔的摘要遠勝于原始數(shù)據(jù)的羅列;一個清晰的工具接口定義也遠比一條模糊的指令有效。


是一門科學(xué),也是一門藝術(shù)

Karpathy長文點評中,同樣認為「上下文工程」是藝術(shù)的一種。

人們往往將提示詞(prompt),聯(lián)想為日常使用中——發(fā)給LLM的簡短任務(wù)描述。

然而,在任何一個工業(yè)級的 LLM 應(yīng)用中,上下文工程都是一門精深的科學(xué),也是一門巧妙的藝術(shù)。

其核心在于,為下一步操作,用恰到好處的信息精準填充上下文窗口。


說它是科學(xué),是因為要做好這一點,需要綜合運用一系列技術(shù),其中包括:

任務(wù)描述與解釋、少樣本學(xué)習(xí)示例、RAG(檢索增強生成)、相關(guān)的(可能是多模態(tài)的)數(shù)據(jù)、工具、狀態(tài)與歷史記錄、信息壓縮等等。

信息太少或格式錯誤,LLM就沒有足夠的上下文來達到最佳性能;

信息太多或關(guān)聯(lián)性不強,又會導(dǎo)致LLM的成本上升、性能下降。

要做好這一點是頗為復(fù)雜的。

說它是藝術(shù),則是因為其中需要依賴開發(fā)者對大模型「脾性」的直覺把握和引導(dǎo)。

除了上下文工程本身,一個LLM應(yīng)用還必須做到:

  • 將問題恰到好處地拆解成控制流

  • 精準地填充上下文窗口

  • 將調(diào)用請求分派給類型和能力都合適的LLM

  • 處理「生成-驗證」的UIUX流程

  • 以及更多——例如安全護欄、系統(tǒng)安全、效果評估、并行處理、數(shù)據(jù)預(yù)取等等…

因此,「上下文工程」只是一個正在興起的、厚重且復(fù)雜的軟件層中的一小部分。

這個軟件層負責(zé)將單個的LLM調(diào)用,以及更多其他操作整合協(xié)調(diào),從而構(gòu)建出完整的LLM應(yīng)用。

Karpathy表示,把這類應(yīng)用輕率地稱為「ChatGPT的套殼」,這種說法不僅老掉牙了,而且大錯特錯。

有網(wǎng)友對此調(diào)侃道,上下文工程,是全新的「氛圍編程」。

Karpathy回應(yīng)稱,「我倒不是想自創(chuàng)個新詞什么的。我只是覺得,大家一提到「提示詞」,就容易把一個其實相當(dāng)復(fù)雜的組件給想簡單了」。

你會用一個提示詞去問LLM「天空為什么是藍色的」。但應(yīng)用程序呢,則是需要為大模型構(gòu)建上下文,才能解決那些為它量身定制的任務(wù)。


智能體成敗,全靠它了

其實,打造真正高效的AI智能體秘訣,關(guān)鍵不在于編寫的代碼有多復(fù)雜,而在于你所提供的上下文有多優(yōu)質(zhì)。

一個效果粗糙的演示產(chǎn)品,同一個表現(xiàn)驚艷的智能體,其根本區(qū)別就在于提供的上下文質(zhì)量。

想象一下,一個AI助理需要根據(jù)一封簡單的郵件來安排會議:

嘿,想問下你明天有空簡單碰個頭嗎?

「粗糙的演示」智能體獲得的上下文很貧乏。它只能看到用戶的請求,別的什么都不知道。

它的代碼可能功能齊全——調(diào)用一個LLM并獲得響應(yīng),但輸出的結(jié)果卻毫無幫助,而且非常機械化:

感謝您的消息。我明天可以。請問您想約在什么時間?

接下來,再看看由豐富的上下文加持的驚艷智能體。

其代碼的主要任務(wù)并非是思考如何回復(fù),而是去收集LLM達成目標所需的信息。在調(diào)用LLM之前,你會將上下文擴展,使其包含:

代碼的主要工作,不是決定如何響應(yīng),而是收集LLM完成目標所需的信息。

在調(diào)用LLM之前,你會擴展上下文,包括:

日歷信息:顯示你全天都排滿了

與此人的過去郵件:用來判斷應(yīng)該使用何種非正式語氣

聯(lián)系人列表:用來識別出對方是一位重要合作伙伴

用于send_invite或send_email的工具

然后,你就可以生成這樣的回復(fù):

嘿,Jim!我明天日程完全排滿了,會議一個接一個。周四上午我有空,你看方便嗎?邀請已經(jīng)發(fā)給你了,看這個時間行不行哈。

這種驚艷的效果,其奧秘不在于模型更智能,或算法更高明,而在于為正確的任務(wù)提供了正確的上下文。

這正是「上下文工程」將變得至關(guān)重要的原因。

所以說,智能體的失敗,不只是模型的失敗,更是上下文的失敗。

要構(gòu)建強大而可靠的 AI 智能體,我們正逐漸擺脫對尋找「萬能提示詞」,或依賴模型更新的路徑。

這一點,深得網(wǎng)友的認同。


其核心在于對上下文的工程化構(gòu)建:即在恰當(dāng)?shù)臅r機、以恰當(dāng)?shù)母袷剑峁┣‘?dāng)?shù)男畔⒑凸ぞ摺?/p>

這是一項跨職能的挑戰(zhàn),它要求我們深入理解業(yè)務(wù)用例、明確定義輸出,并精心組織所有必要信息,從而使LLM能夠真正「完成任務(wù)」。

最后,借用網(wǎng)友一句話,「記憶」才是AGI拼圖的最后一塊。


參考資料:

https://www.philschmid.de/context-engineering

https://news.ycombinator.com/item?id=44427757


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
楊冪登臺意外踩裙擺摔倒!2秒內(nèi)淡定起身調(diào)整狀態(tài),微笑銜接演講,被贊教科書級救場

楊冪登臺意外踩裙擺摔倒!2秒內(nèi)淡定起身調(diào)整狀態(tài),微笑銜接演講,被贊教科書級救場

極目新聞
2025-07-05 08:58:50
女兒高考自己估分400,我正打算讓她讀專科,成績出來那天我傻眼

女兒高考自己估分400,我正打算讓她讀專科,成績出來那天我傻眼

白云故事
2025-07-06 07:45:08
山東一男子花800萬買比特幣,6年后兒子患病急用錢,看到余額后愣了

山東一男子花800萬買比特幣,6年后兒子患病急用錢,看到余額后愣了

嘉琪Feel
2025-07-01 19:43:01
機上74人全部遇難,俄方通報載有烏戰(zhàn)俘的俄運輸機墜毀事件:烏軍指揮官下令擊毀,對其啟動國際通緝

機上74人全部遇難,俄方通報載有烏戰(zhàn)俘的俄運輸機墜毀事件:烏軍指揮官下令擊毀,對其啟動國際通緝

魯中晨報
2025-07-05 19:35:02
1700 億燒進去了!普京首次承認,戰(zhàn)爭太燒錢,俄羅斯財政很難

1700 億燒進去了!普京首次承認,戰(zhàn)爭太燒錢,俄羅斯財政很難

武事匯
2025-07-06 18:56:53
Deepseek:世界上質(zhì)量最好的車,推薦唯一的品牌!

Deepseek:世界上質(zhì)量最好的車,推薦唯一的品牌!

奶油芒
2025-07-04 09:23:00
“大而美”法案引連鎖反應(yīng):本田止步電動SUV 特斯拉或推出“平價版”Model Y

“大而美”法案引連鎖反應(yīng):本田止步電動SUV 特斯拉或推出“平價版”Model Y

財聯(lián)社
2025-07-05 18:40:13
不滿?羅德里戈賽前曬出自己的海報,得知坐替補席后刪除

不滿?羅德里戈賽前曬出自己的海報,得知坐替補席后刪除

雷速體育
2025-07-06 12:23:30
太饑渴!一情侶長椅上行為不雅,走光都不管,全程被拍

太饑渴!一情侶長椅上行為不雅,走光都不管,全程被拍

說點真嘞叭
2025-07-02 05:47:43
44歲阿嬌節(jié)目哭訴:正常情況我應(yīng)該有個20歲的孩子,但已經(jīng)沒機會

44歲阿嬌節(jié)目哭訴:正常情況我應(yīng)該有個20歲的孩子,但已經(jīng)沒機會

銀河史記
2025-07-05 12:59:12
中國歷史首人!CBA扣籃王陳登星飛躍汽車3扣滿分 獲世界扣籃冠軍

中國歷史首人!CBA扣籃王陳登星飛躍汽車3扣滿分 獲世界扣籃冠軍

醉臥浮生
2025-07-06 15:20:01
事關(guān)訪華,特朗普作出回應(yīng),有一個問題必須解決,中方已提2要求

事關(guān)訪華,特朗普作出回應(yīng),有一個問題必須解決,中方已提2要求

梁訊
2025-07-05 20:27:13
仗著親媽是張凱麗,就在節(jié)目上四處作妖,最終連郝蕾都看不下去了

仗著親媽是張凱麗,就在節(jié)目上四處作妖,最終連郝蕾都看不下去了

老吳教育課堂
2025-07-06 15:30:09
今年海鮮什么情況?帝王蟹跳水80%,外媒:奢侈標桿也扛不住了?

今年海鮮什么情況?帝王蟹跳水80%,外媒:奢侈標桿也扛不住了?

瘋狂小菠蘿
2025-07-06 13:53:04
馬斯克:美國人將失去社保

馬斯克:美國人將失去社保

古老板的老巢
2025-07-05 21:12:11
安普瑞斯74張3C證書被暫停或撤銷

安普瑞斯74張3C證書被暫停或撤銷

界面新聞
2025-07-06 12:23:47
大年三十,婆家人坐等著開飯,我笑著進門:今年已經(jīng)在外面吃飽了

大年三十,婆家人坐等著開飯,我笑著進門:今年已經(jīng)在外面吃飽了

小卿情感故事
2025-07-06 16:52:42
面相全變了!再看35歲鹿晗和27歲關(guān)曉彤,馬伊琍的話終于有人信了

面相全變了!再看35歲鹿晗和27歲關(guān)曉彤,馬伊琍的話終于有人信了

南南說娛
2025-07-05 15:31:15
火化工自述:對生死已經(jīng)麻木,年輕漂亮女尸會多留兩晚

火化工自述:對生死已經(jīng)麻木,年輕漂亮女尸會多留兩晚

小哥很OK
2024-07-08 17:03:04
男子冒充外賣員入戶,與女主播發(fā)生6次關(guān)系,女子哭訴:還帶道具

男子冒充外賣員入戶,與女主播發(fā)生6次關(guān)系,女子哭訴:還帶道具

書畫藝術(shù)收藏
2025-07-02 19:10:03
2025-07-06 19:44:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13002文章數(shù) 66081關(guān)注度
往期回顧 全部

科技要聞

小米YU7首批交付,雷軍現(xiàn)身為車主開車門

頭條要聞

杭州39歲男子拿下世界頂級扣籃賽冠軍 穿鞋身高1米76

頭條要聞

杭州39歲男子拿下世界頂級扣籃賽冠軍 穿鞋身高1米76

體育要聞

梅西獻2神作:1V3一條龍 半場奔襲連過4人

娛樂要聞

2025上半年最能扛收視5位男演員排名?

財經(jīng)要聞

馬斯克宣布:美國黨成立了!

汽車要聞

阿斯頓·馬丁跑車陣容將齊聚2025古德伍德速度節(jié)

態(tài)度原創(chuàng)

手機
藝術(shù)
旅游
公開課
軍事航空

手機要聞

榮耀下半年新品大爆發(fā)!Magic8手機、平板、PC全家桶來了

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以伊沖突后 哈梅內(nèi)伊首次公開露面

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 堆龙德庆县| 扎囊县| 吉安市| 保靖县| 蒙阴县| 兴和县| 巫溪县| 哈尔滨市| 离岛区| 谷城县| 镇雄县| 广宗县| 濮阳县| 光山县| 祁阳县| 文昌市| 灵山县| 宁波市| 丽水市| 濉溪县| 交城县| 塘沽区| 五峰| 石河子市| 高雄市| 旬阳县| 永平县| 全州县| 奉新县| 张家港市| 泰兴市| 安国市| 昆明市| 石门县| 凤台县| 轮台县| 上思县| 交城县| 云阳县| 龙海市| 巨鹿县|