上下文工程(Context Engineering)是指設計和構建一個動態系統,以正確的格式在正確的時間為大語言模型(LLM)提供恰當的信息和工具,從而使其能夠可靠地完成指定任務。它不僅關注靜態的提示詞設計,更注重系統性、動態性和信息的精準性。具體而言,上下文工程包括以下幾個核心要素:
①用正確的信息以確保模型獲取到完成任務所需的關鍵信息;②用正確的工具提供模型在執行任務時可能需要的各種功能支持。
③用正確的格式以清晰、簡潔、結構化的方式呈現信息。上下文工程超越了傳統的提示工程,涉及上下文檢索與生成、上下文處理、上下文管理等多個基礎組件,并且通過檢索增強生成(RAG)、記憶系統、工具集成推理、多智能體系統等系統級實現,構建復雜的應用場景。它強調動態生成和管理上下文,在不同的任務和場景中,根據需求實時調整。
上下文工程的關鍵在于首先對問題進行有效的分解,這能為后續的處理工作提供清晰的方向和基礎。然后,要根據具體的任務需求和問題特點,恰當調用大中小不同規模的模型,以發揮各模型的優勢。在實際操作過程中,還需要進行不同尺度的試錯調整,以便及時發現問題并進行優化。同時,多智能體的組織協同也至關重要,通過合理組織和協同多個智能體,可以實現更高效的任務執行和問題解決。這四個方面相互關聯、相互影響,共同構成了上下文工程的核心要素。
1、問題的有效分解
首先要精準地界定問題所涉及的范圍和邊界,把復雜的大問題拆解成多個相對獨立且易于處理的小問題,如在一個智慧交通系統項目中,大問題是“如何緩解城市交通擁堵”,將其分解為“交通流量監測”、“信號燈智能調控”、“公共交通優先通行策略”等小問題。其次,要確定并識別問題的不同層次和相互關系,有些問題是基礎性的,需要優先解決;有些問題則是依賴于其他問題的解決結果。比如在工業生產優化中,“設備故障預測”是基礎問題,“生產流程重構”則建立在設備可靠運行的基礎上。
2、大中小模型的恰當調用
大模型通常具有廣泛的知識和強大的通用能力,適用于需要處理大量復雜信息和復雜邏輯推理的場景。如在自然語言處理中的機器翻譯任務,大模型可以利用其海量的多語言語料和復雜的語言結構知識,生成較為準確的翻譯結果。同時,中小模型則在特定領域或特定任務上有一定的優勢。小模型可以針對特定問題進行優化,具有較高的執行效率和針對性,如在圖像識別中,對于某種特定缺陷的檢測,可以訓練一個小模型,使其對這種缺陷的特征高度敏感,從而快速準確地完成檢測任務。
3、不同尺度的試錯調整
在整體項目或方案設計階段,從宏觀上嘗試不同的思路和方法,評估其可行性和效果。比如在城市規劃中,嘗試不同的功能區劃分方案,通過模擬分析其對交通、環境、居民生活等方面的影響,及時發現和糾正不合理的方案。另外,微觀尺度的優化也很重要,在具體任務或模型訓練過程中,對參數、算法等進行細致的調整,以機器學習模型訓練為例,通過不斷地調整學習率、正則化參數等,使模型在訓練數據上的表現逐步提高,并且在驗證數據上也能保持較好的泛化能力。
4、多智能體的組織協同
在多智能體系統中,明確每個智能體的角色和任務非常重要,在一個智能物流系統中,有負責貨物運輸的智能運輸機器人、負責倉庫管理的智能倉儲機器人、負責路徑規劃的智能導航系統等,它們各自承擔不同的任務。建立有效的通信和協作機制,使智能體之間能夠實時共享信息、協調行動,可以采用集中式控制、分布式協作等多種方式。在智能物流系統中,智能運輸機器人需要與智能倉儲機器人和智能導航系統實時通信,根據倉儲機器人的發貨指令和導航系統的路徑規劃,準確地將貨物運輸到指定地點。
未來上下文工程的發展趨勢是實現人機環境系統智能,通過問題的有效分解、大中小模型的恰當調用、不同尺度的試錯調整和多智能體的組織協同,讓系統能夠更好地理解和適應復雜的現實環境,實現與人的高效協同,從而為用戶提供更智能、更精準的服務和解決方案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.