99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

中美澳15位科學家定義AI新時代學科,揭示大模型存在根本性不對稱

0
分享至

還記得安德烈·卡帕西(Andrej Karpathy)在上個月帶火的上下文工程嗎?他曾盛贊上下文工程“是一門精心設計、科學填充上下文窗口的精密藝術。”


(來源:X)

時隔不到一個月,上下文工程更是被一眾科學家正式定義為一門學科。日前,來自中美澳累計 6 家高校科研機構的 15 名研究人員,通過分析 1400 多篇研究論文,首次將上下文工程作為一門正式學科加以全面探討,并指出它能夠系統性地設計、優化和管理大模型的信息有效載荷。


(來源:https://arxiv.org/pdf/2507.13334)

論文作者們分別來自中國科學院計算技術研究所、美國加利福尼亞大學默塞德分校、澳大利亞昆士蘭大學、北京大學、清華大學和中國科學院大學。論文中,研究人員將上下文工程確立為開發復雜 AI 系統的關鍵基礎,并指出這類復雜 AI 系統的特征在于能夠有效整合外部知識、維持持久記憶,以及能與復雜環境進行動態交互。

本次研究的主要貢獻在于提出了一個統一的分類框架,該框架將上下文工程技術分為基礎組件和系統實現方法兩大塊。通過這一系統性的研究,他們得出了以下關鍵見解。

  • 第一,盡管大模型在理解復雜語境上有著出色表現,但是在生成同樣復雜的輸出時卻存在局限性,而這兩者之間存在根本性的不對稱,這種理解與生成之間的差距是大模型領域面臨的最關鍵挑戰之一。
  • 第二,本次研究表明多種技術正在以日益復雜的方式進行協同融合,這種集成模式所產生的綜合能力已經超越各獨立組件的簡單疊加。研究人員所觀察到一個明顯趨勢是:模塊化和組合性不斷增強,使得架構能夠靈活適應各種應用,同時還能保持系統的一致性。

總的來說,通過系統地分析 1400 多篇論文,本次綜述論文不僅為該領域確立了技術路線圖,還揭示了一個關鍵的研究空白:即模型能力之間存在根本性的不對稱。盡管當前模型通過先進的上下文工程得到了增強,在理解復雜上下文方面也有著出色表現,但在生成同樣復雜的長篇輸出時卻存在明顯的局限性,而填補這一空白是未來領域內的首要任務。


(來源:https://arxiv.org/pdf/2507.13334)



將上下文工程進行概念化

很多人都知道,大模型的性能和效能從根本上取決于它們所接收的上下文。這種上下文——從簡單的指令提示到復雜的外部知識庫,是引導其行為、擴充其知識和釋放其能力的主要機制。隨著大模型從基本的“指令遵循系統”演變為復雜應用的“核心推理引擎”,設計和管理其信息載荷的方法也相應地演變為上下文工程這樣一門正式學科。

當前,上下文工程領域正以爆炸性的速度擴展,催生了眾多專業且分散的研究方向。如前所述,研究人員將這一領域進行了概念化,進而指出上下文工程由以下兩個部分組成:基礎組件和系統實現方法。

基礎組件通過三個關鍵階段構成了上下文工程的系統性流程:

1.第一個階段是上下文檢索與生成,包括基于提示的生成和外部知識獲取;

2.第二個階段是上下文處理,這涉及到長序列處理、自我完善機制和結構化信息整合;

3.第三個階段是上下文管理,這涉及到內存層次結構、壓縮技術和優化策略。

這些基礎組件催生了更復雜的面向應用的實現方式,進一步地這些實現方式能夠將大模型與外部現實聯系起來。

系統實現方法主要包括:

1.第一種是高級檢索增強生成,該技術目前已經發展為模塊化、智能體驅動的架構,能被用于動態知識注入;

2.第二種是模擬人類認知能力以便實現持久信息保留的顯性內存系統;

3.第三種工具集成推理,它能將模型從被動的文本生成器轉變為能夠動態利用工具和操縱環境的主動世界交互者。這種實現方式使模型能夠通過函數調用機制、集成推理框架和復雜的環境交互能力,突破其固有的局限性。

4.第四種是基于智能體系統的完整生態系統,這種技術代表著目前上下文工程的巔峰技術,它能讓智能體利用函數調用和工具集成推理來與世界進行交互,并能夠通過依賴于復雜的智能體通信協議和上下文編排,進而在多智能體配置中實現復雜目標。


(來源:https://arxiv.org/pdf/2507.13334)



上下文工程的基礎組件、系統實現和評估

研究人員指出,當前大模型領域的碎片化發展掩蓋了技術之間的根本聯系,也給業內人士帶來了研究障礙和使用障礙。因此,該領域迫切需要一個統一的框架來系統性地整合這些技術,進而闡明其基本原理,以及揭示它們之間的相互依賴關系。

隨著大模型從簡單的指令遵循系統演變為復雜、多應用的核心推理引擎,與之交互的方法也必須隨之發展。

研究人員認為,提示工程固然很重要,但是已經無法全面涵蓋現代 AI 系統所需的信息載荷的設計、管理和優化。關于此,在本文開頭的 X 貼文截圖中卡帕西也表達了類似觀點。原因在于,這些 AI 系統并非基于單一、靜態的文本字符串進行操作,它們利用的是動態、結構化且多方面的信息流。為了彌補這一關鍵空白,本次綜述論文首次針對大模型的上下文工程進行了全面且系統的回顧,同時引入并規范了上下文工程這一學科。

如前所述,上下文工程建立在三個基本組件之上,這些組件能夠共同應對大模型中信息管理的核心挑戰:

  • 上下文檢索與生成,它通過提示工程、外部知識檢索和動態上下文組裝來獲取適當的上下文信息;
  • 上下文處理,它通過長序列處理、自我優化機制和結構化數據整合,來針對獲取的信息進行轉換和優化;
  • 上下文管理,它通過解決基本約束、實施復雜的內存層次結構以及開發壓縮技術,來處理上下文信息的有效組織和利用。

這些基礎組件為所有上下文工程的實施奠定了理論和實踐基礎,并能形成一個全面的框架。其中,每個組件都能處理上下文工程流程的不同方面,同時各組件之間保持協同關系,從而實現全面的上下文優化和有效的上下文工程策略。

基于上下文工程的基礎組件,研究人員探討了復雜的系統實現方式,這些實現方式可以將上述組件整合到實用的智能架構中,同時這些實現代表了從理論框架到可部署系統的演進。

如前所述,研究人員提出了四類系統實現方式:

  • 第一類實現方式是檢索增強生成系統,它通過模塊化架構和圖增強方法實現外部知識的整合。
  • 第二類實現方式是內存系統,它通過復雜的內存架構展示了持續的上下文管理,從而能夠支持長期學習。
  • 第三類實現方式是工具集成推理,它通過函數調用和環境交互,將語言模型轉化為能夠與世界交互的實體。
  • 第四類實現方式是多智能體系統,它通過通信協議和編排機制呈現出協調一致的方法。

以上四類實現方式中的每一個都基于基礎組件構建,同時解決了上下文利用中的特定挑戰,展示了理論原則轉化為實際系統的背后原理。


(來源:https://arxiv.org/pdf/2507.13334)



“AI 模型的性能本質上取決于上下文信息”

研究人員指出,當前上下文工程正處于一個關鍵的轉折點,當前這種基礎進展與新興應用需求相融合的階段,既創造了前所未有的創新機遇,也暴露出了一些必須在多個維度開展持續研究才能解決的根本性挑戰。

隨著該領域逐漸從孤立的組件開發向集成系統架構過渡,一些研究難題的復雜性也會呈現指數級的增長,因此需要采用跨學科的方法,將理論計算機科學、實用系統工程和特定領域專業知識結合起來。

基于此,研究人員通過本次論文為 AI 從業者提供了一個統一的框架。與此同時,研究人員通過本次研究所發現的大模型評估挑戰,凸顯了該領域對于全面評估框架的需求,這類全面評估框架需要能夠捕捉上下文工程系統所展現出的復雜、動態的行為。因此,傳統評估方法對于多組件集成、具有自適應行為且長期持續運行的大模型來說已經顯得力不從心。但在這之中也蘊含著一些重大機遇,比如未來人們可以開發用于高效長上下文處理的下一代架構、構建智能上下文組裝系統,以及打造多智能體的協調機制等。

總的來說,本次綜述論文不僅呈現了該領域的一些現狀,也為未來研究提供了路線圖,并將上下文工程確立為一門獨立學科,它的獨立性體現在它擁有獨屬于自身的原則、方法和挑戰,能夠推動并支持具有上下文感知能力的AI 模型實現“負責任”的發展。

而隨著大模型的不斷發展,“AI 模型的性能本質上取決于上下文信息”的這一關于上下文工程的核心洞見,仍將在 AI 模型的發展中占據關鍵地位。未來,隨著 AI 模型逐漸朝著復雜的多組件系統發展,上下文工程有望在 AI 發展中扮演日益核心的角色。而上下文工程的跨學科性質,即其涵蓋計算機科學、認知科學、語言學以及特定領域專業知識的特點,也要求人們必須采取跨領域合作的方法來將 AI 之路走寬走遠。

參考資料:

https://arxiv.org/pdf/2507.13334

https://x.com/karpathy

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結果曝光

我不想死!游客在米蘭被割喉,血流滿身絕望哭喊,原因結果曝光

鋭娛之樂
2025-07-19 01:55:03
美國解禁H20芯片AB面,黃仁勛一年三次來華的“芯”事

美國解禁H20芯片AB面,黃仁勛一年三次來華的“芯”事

新京報
2025-07-19 15:56:50
福建福耀科技大學最低投檔線公布,超過多所雙一流名校!曹德旺:首年8億元預算招50個學生,對標斯坦福

福建福耀科技大學最低投檔線公布,超過多所雙一流名校!曹德旺:首年8億元預算招50個學生,對標斯坦福

每日經濟新聞
2025-07-19 17:50:10
iPhone可能得漲價,因為京東方在正面硬剛三星。。。

iPhone可能得漲價,因為京東方在正面硬剛三星。。。

差評XPIN
2025-07-19 00:10:12
19歲高考生講述被騙緬甸經歷:通過招聘軟件求職,有人稱當主播掙大錢

19歲高考生講述被騙緬甸經歷:通過招聘軟件求職,有人稱當主播掙大錢

極目新聞
2025-07-19 14:20:09
娃哈哈發家黑歷史:激素營養液坑娃,國資攤派強賣,第一桶金帶血

娃哈哈發家黑歷史:激素營養液坑娃,國資攤派強賣,第一桶金帶血

爆角追蹤
2025-07-19 23:29:04
向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

李砍柴
2025-07-18 23:42:24
司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

司機朋友:宗馥莉脾氣大,司機買來麥當勞不給開車門,得從窗戶送

古希臘掌管松餅的神
2025-07-19 08:57:51
“我本來能上985的”,女生報考福耀科技大后悔,反被招生辦打臉

“我本來能上985的”,女生報考福耀科技大后悔,反被招生辦打臉

妍妍教育日記
2025-07-19 10:16:22
土耳其戰以色列,中東新局勢洗牌

土耳其戰以色列,中東新局勢洗牌

楊風
2025-07-18 23:24:30
放棄了太多!拉什福德為去巴薩曾狂加練+愿大幅降薪 現成功租借

放棄了太多!拉什福德為去巴薩曾狂加練+愿大幅降薪 現成功租借

直播吧
2025-07-19 23:08:18
鄭欽文完成右肘手術

鄭欽文完成右肘手術

界面新聞
2025-07-19 17:50:27
俄烏紅軍村生死對決,F16再次擊落蘇35

俄烏紅軍村生死對決,F16再次擊落蘇35

史政先鋒
2025-07-19 20:32:44
六連勝5分領跑!南通2-1鹽城 程鑫精彩抽射破門鹽城首敗仍居第2

六連勝5分領跑!南通2-1鹽城 程鑫精彩抽射破門鹽城首敗仍居第2

直播吧
2025-07-19 21:43:15
炸裂!杜建英被曝腳踩兩條船,舊照曝光,與原配從未離婚育有一子

炸裂!杜建英被曝腳踩兩條船,舊照曝光,與原配從未離婚育有一子

吭哧有力
2025-07-19 16:23:44
柜姐群毆顧客后續!女兒崩潰哭泣,路人曝實情,店鋪存在多次差評

柜姐群毆顧客后續!女兒崩潰哭泣,路人曝實情,店鋪存在多次差評

鋭娛之樂
2025-07-19 19:11:06
女籃負于日本無緣決賽,張子宇被日本16記三分球瘋狂點名

女籃負于日本無緣決賽,張子宇被日本16記三分球瘋狂點名

李廣專業體育評論
2025-07-19 21:19:07
后續!暴走團領隊囂張回應,央媒發文嚴厲批評,這下警方尷尬了!

后續!暴走團領隊囂張回應,央媒發文嚴厲批評,這下警方尷尬了!

譚談社會
2025-07-19 16:09:27
娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

娃哈哈事件番外篇:紅二代華女李蒂芙尼在美國涉謀殺案,母親從中國趕來交5億天價保釋金

老爵爺沉思錄
2025-07-18 22:25:04
吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕就上演!

吃相太難看!陳佩斯砸上億的電影還沒上映,令人惡心一幕就上演!

春秋論娛
2025-07-17 19:46:54
2025-07-20 00:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15427文章數 513915關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

體育要聞

女籃無緣亞洲杯決賽 韓旭淚灑發布會

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

游戲
親子
房產
公開課
軍事航空

LPL第三階段:宇智波柴,摧毀極影村!TES三局擊潰IG!

親子要聞

孩子突然不愿意上學?4個深層原因+4步拯救法

房產要聞

漏水、開裂…為阻止降價,海口這個盤業主集體爆黑料,還講鬼故事!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:印巴沖突期間有5架戰機被擊落

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 隆化县| 南投市| 泾阳县| 河津市| 故城县| 桐城市| 皋兰县| 芷江| 万安县| 廉江市| 游戏| 上高县| 杭锦旗| 金门县| 崇明县| 洪洞县| 睢宁县| 南川市| 忻州市| 南皮县| 施秉县| 恩平市| 邓州市| 江油市| 大名县| 娄烦县| 苏州市| 鹤庆县| 芜湖市| 凭祥市| 青海省| 宁晋县| 五指山市| 贵定县| 新野县| 南江县| 岑溪市| 梓潼县| 额济纳旗| 桓仁| 宿松县|