99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

RAG原作者:我們仍然需要RAG(并且永遠需要)

0
分享至

來源 | 思考機器 作者 |Douwe Kiela

本文作者 Douwe Kiela,RAG 論文(Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks)作者之一。

以下為全文:

每隔幾個月,人工智能領域就會經歷類似的模式。一個具有更大上下文窗口的新模型問世,社交媒體上便會充斥著“RAG 已死”的宣言。Meta 最近的突破再次引發了這場討論——Llama 4 Scout 驚人的 1000 萬(理論上)token 上下文窗口代表著一次真正的飛躍。

但這些論斷——無論是針對上下文窗口的突破、微調技術的進步,還是模型上下文協議(MCP)的出現——都誤解了 RAG 的目的,以及為何它在人工智能領域將永遠占有一席之地。

RAG的初衷

五年前,我在 Meta 基礎人工智能研究中心(FAIR,前身為 Facebook 人工智能研究中心)的團隊提出了 RAG(Retrieval-Augmented Generation,檢索增強生成)的概念。RAG 的目標是利用外部知識來增強模型,創造一種結合了參數化記憶和非參數化記憶的兩全其美的解決方案。

簡單來說,RAG 通過檢索語言模型未經訓練的數據源中的相關信息,并將其注入模型的上下文中,從而擴展了語言模型的知識庫。

這種方法旨在解決生成式語言模型的許多固有缺陷:

  • 無法訪問私有(企業內部)數據模型通常基于公共數據進行訓練,但往往需要那些不斷變化和擴展的專有信息。

  • 過時的參數知識即使模型頻繁更新,其訓練數據截止日期與當前時間之間總會存在差距。

  • 幻覺和歸因問題模型經常編造聽起來合理但錯誤的信息。RAG 通過將回答基于真實來源,并提供引文讓用戶核實信息,解決了這個問題。

聽起來耳熟嗎?現在已經不是 2020 年了,但這些同樣的問題至今依然存在。甚至可以說,隨著組織推動 AI 系統處理日益復雜和關鍵的任務,這些問題變得更加突出了。核心挑戰依然是:我們如何將強大的生成式模型與公司所依賴的海量知識庫連接起來?

為什么我們仍然需要RAG(并且永遠需要)

高效而精確的檢索在人工智能中將始終扮演重要角色。這一點在一個廣為流傳的 LinkedIn 帖子中得到了很好的闡述,但我將重申為什么我們不能僅僅將所有數據加載到模型的上下文中:自首個具備大上下文窗口的 LLM 問世以來,RAG 就一直面臨“消亡”的論調。

該 LinkedIn 帖子:

一些值得注意的 RAG“死亡宣告”包括:

  • 2023 年 5 月:Anthropic 的 Claude,上下文窗口達 10 萬 token

  • 2024 年 2 月:Google 的 Gemini 1.5,上下文窗口達 100 萬 token

  • 2025 年 3 月:模型上下文協議(Model Context Protocol)讓你能直接與你的數據對話 (注:原文日期可能是筆誤)

但現實情況是:

即使擁有高達 200 萬 token 這樣驚人的上下文窗口,當前的長上下文 LLM 也只能處理演示性質的數據集(toy datasets)。
例如,100 萬 token 的上下文窗口(大致)相當于約 1500 頁文檔。
這對于演示來說很亮眼,但對于生產級別的應用而言是不足夠的。

不過,讓我們假設我們擁有一個無限 token 的上下文窗口:

  • 可擴展性與成本:處理數百萬 token 速度緩慢,且在計算和財務上都代價高昂。即使計算成本在下降,延遲對于應用程序來說也可能是一個大問題。

  • 性能下降:LLM 仍然受困于“中間丟失”(lost in the middle)的問題。這意味著它們無法有效利用長文本中間部分的信息。通過剔除不相關文檔并避免“大海撈針”的情況,您將獲得更好的結果。

  • 數據隱私:將 所有 數據提供給基礎模型可能引發嚴重的數據隱私問題。尤其是在醫療保健或金融服務等受到嚴格監管的行業,您需要對數據強制執行基于角色的訪問控制。

底線是:您同時需要長上下文 LLM 和 RAG。

但既然“RAG”這個術語似乎如此具有爭議性,那我們不妨這樣說:
我們不必非得稱之為 RAG。
我們可以就叫它檢索 (retrieval)
或者叫上下文篩選 (context curation)

無論您決定怎么稱呼它,能夠控制進入上下文窗口的數據質量,將決定最終生成輸出的質量。

畢竟,垃圾進,垃圾出。

  • 可擴展性– 您的企業知識庫是以 TB 或 PB 來衡量的,而不是 token。即使有 1000 萬 token 的上下文窗口,您仍然只能看到可用信息的極小一部分。這就是為什么檢索技術的創新一直快速發展,混合搜索、查詢轉換、自我反思、主動檢索以及對結構化數據的支持等方面的進步,都在幫助您在知識庫中找到正確的信息。

  • 準確性– 有效的上下文窗口與產品發布時宣傳的大相徑庭。研究一致表明,模型在遠未達到其官方極限時性能就會下降。在實際測試中,同樣的模式也會出現,模型難以準確引用深埋在其上下文中的信息。這種“上下文懸崖”意味著僅僅將更多內容塞入窗口并不會帶來更好的結果。


  • 延遲– 將所有內容加載到模型上下文中會導致響應時間顯著變慢。對于面向用戶的應用程序,這會造成糟糕的用戶體驗,人們會在得到答案前就放棄交互。基于檢索的方法可以通過僅添加最相關的信息來提供更快的響應。

  • 效率– 你會在需要回答一個簡單問題時去讀完整本教科書嗎?當然不會!RAG 提供了相當于直接翻到相關頁面的能力。處理更多 token 不僅更慢,而且極其低效,并且比使用 RAG 精準定位所需信息要昂貴得多。

警惕錯誤的二分法

在谷歌搜索“RAG vs”,你會看到一長串建議的查詢補全——“長上下文”、“微調”、“MCP”。這種框架設定制造了一種人為的選擇,并沒有反映這些技術實際上如何協同工作的最佳方式。


實際上,這些概念沒有一個是相互排斥的,甚至不是相互沖突的——它們都以互補的方式幫助解決前沿模型的局限性:

  • RAG提供了訪問模型知識庫之外信息的途徑

  • 微調改善了信息處理和應用的方式

  • 更長的上下文允許檢索更多信息供模型推理

  • MCP簡化了 Agent 與 RAG 系統(及其他工具)的集成

我們在生產環境中看到的最復雜的 AI 系統結合了這些方法,根據各自的優勢來使用每種工具,而不是宣布某一個獲勝并將其他工具拋棄。

正如一位 Twitter 用戶最近所說:“聲稱大型 LLM 上下文窗口取代了 RAG,就像說因為有足夠的內存(RAM)就不需要硬盤一樣。”正是如此!你的電腦有磁盤、內存和網卡是有原因的。它們服務于不同的目的,并作為一個系統協同工作。RAG、微調和大型上下文窗口在 AI 中也是如此。


結論

我們不需要在 RAG 與長上下文窗口、微調或 MCP 之間做出選擇。真正能創造價值的 AI 解決方案不會固守單一方法;它們會根據要解決的具體問題混合搭配使用工具。

但下一次宣稱“RAG 已死”的論調出現只是時間問題,所以,如果你將來想引用這篇文章,可以在 isragdeadyet.com 找到它。這個網站將作為一個活生生的證明,展現檢索在 AI 系統中持久的重要性,并且每當下一波“RAG 已死”的帖子不可避免地出現時,它都會更新。

如果你的系統無法利用你的專有數據,持續提供過時信息,或者缺乏你所需的專業知識,那么讓我們談談。我們構建了一個將智能檢索與前沿 LLM 相結合的系統,來解決這些長期存在的難題。因為重要的不是哪種技術在某場人為的競賽中獲勝,而是構建能夠真正解決實際問題的方案。”

原文鏈接: https://contextual.ai/blog/is-rag-dead-yet/

最后推薦一個我正在學習的DeepSeek應用開發課

本課程將會涉及當前業界最主流的 AI 應用開發思想、套路、工具以及框架,設計的實戰項目也會聚焦 DeepSeek 模型的某個特點。對于 AI 開發老鳥,可以與時俱進,查漏補缺,掌握業界前沿的開發思想和工具;而對于 AI 開發新手,則可以繞過過去幾年我摸爬滾打的彎路,借力 DeepSeek,快速入門 AI 應用開發領域。





特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一搶而空!認購率超100%…很多上海人最近連軸轉:下手要快!

一搶而空!認購率超100%…很多上海人最近連軸轉:下手要快!

申消費
2025-05-08 09:35:45
鮑威爾:通脹已經大幅度下降

鮑威爾:通脹已經大幅度下降

財聯社
2025-05-08 02:32:07
馬科斯被爆重大丑聞,菲律賓國庫被掏空?杜特爾特的機會來了

馬科斯被爆重大丑聞,菲律賓國庫被掏空?杜特爾特的機會來了

洞悉評說
2025-05-08 15:09:32
5架戰機被擊落,印度給中國武器打了一波廣告!

5架戰機被擊落,印度給中國武器打了一波廣告!

燕梳樓頻道
2025-05-07 17:30:13
蔣介石有多風流?貼身秘書晚年說出真相:白天干革命,晚上逛窯子

蔣介石有多風流?貼身秘書晚年說出真相:白天干革命,晚上逛窯子

尚曦讀史
2025-05-07 21:10:02
遠華集團總裁賴昌星,在獄中對董文華的描述,聽后讓人咋舌

遠華集團總裁賴昌星,在獄中對董文華的描述,聽后讓人咋舌

蘭姐說故事
2025-02-17 22:00:03
天上掉下來的國運:印度和巴基斯坦開戰,無論輸贏,中方都將獲益

天上掉下來的國運:印度和巴基斯坦開戰,無論輸贏,中方都將獲益

妙知
2025-05-07 22:06:13
阿莫林:賽季結束時,我們可能是英超史上贏得歐戰冠軍的最差球隊

阿莫林:賽季結束時,我們可能是英超史上贏得歐戰冠軍的最差球隊

直播吧
2025-05-07 21:00:02
中央明確,延退實施,科級公務員1966年出生,不能彈性延遲退休?

中央明確,延退實施,科級公務員1966年出生,不能彈性延遲退休?

阿纂看事
2025-05-08 08:08:51
涉嫌嚴重違紀違法,李玉杰接受審查調查

涉嫌嚴重違紀違法,李玉杰接受審查調查

大象新聞
2025-05-07 11:50:04
危險信號,伊俄下場,印巴局勢嚴峻升級,中方必須做好最壞打算

危險信號,伊俄下場,印巴局勢嚴峻升級,中方必須做好最壞打算

Ck的蜜糖
2025-05-08 15:24:07
以其昏昏,使人昭昭——借吹捧邏輯學貶低辯證法,吃相未免太難看

以其昏昏,使人昭昭——借吹捧邏輯學貶低辯證法,吃相未免太難看

一老沈一
2025-05-07 15:24:23
女醫生不建議打高潮針和做縮陰:不和諧不是鎖松了,而是鑰匙小了

女醫生不建議打高潮針和做縮陰:不和諧不是鎖松了,而是鑰匙小了

星河也燦爛
2025-05-06 16:47:59
日本媒體:按照過往經驗,馬龍有可能會是未來的中國乒協主席!

日本媒體:按照過往經驗,馬龍有可能會是未來的中國乒協主席!

好乒乓
2025-05-07 13:46:35
趙心童遇“送命問題”!央視讓快問快答:奧沙利文or丁俊暉二選一

趙心童遇“送命問題”!央視讓快問快答:奧沙利文or丁俊暉二選一

三十年萊斯特城球迷
2025-05-08 15:58:59
莫拉蒂:淘汰巴薩是最佳生日禮物:亞馬爾將比肩貝利馬拉多納

莫拉蒂:淘汰巴薩是最佳生日禮物:亞馬爾將比肩貝利馬拉多納

懂球帝
2025-05-08 17:22:28
澳門這一夜上演明星修羅場,張柏芝和李冰冰熱聊阿sa表情耐人尋味

澳門這一夜上演明星修羅場,張柏芝和李冰冰熱聊阿sa表情耐人尋味

曉風說
2025-05-08 11:37:53
紫牛頭條|北大畢業生報警稱被女主播詐騙260萬元,主播稱相識時系單身,警方已立案

紫牛頭條|北大畢業生報警稱被女主播詐騙260萬元,主播稱相識時系單身,警方已立案

揚子晚報
2025-05-08 08:54:44
特朗普拒絕降低關稅以推進美中談判,但這類商品或是例外

特朗普拒絕降低關稅以推進美中談判,但這類商品或是例外

北美商業電訊
2025-05-08 17:14:58
貴州派出所長遭村民搶槍,連射5槍致2人死亡

貴州派出所長遭村民搶槍,連射5槍致2人死亡

丹寶說文史
2023-12-06 19:18:34
2025-05-08 18:00:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
2949文章數 11008關注度
往期回顧 全部

科技要聞

OpenAI任命"應用CEO" 奧特曼聚焦研究/安全

頭條要聞

女子走路打電話轉身撞男子摔骨折 法院調解男子賠7萬

頭條要聞

女子走路打電話轉身撞男子摔骨折 法院調解男子賠7萬

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

劉畊宏老婆補刀 清場風波口碑翻車!

財經要聞

57政策解讀:力度空前的系統性穩增長舉措

汽車要聞

23.68萬元起 新款途觀L Pro限時優惠5.8萬

態度原創

房產
親子
旅游
公開課
軍事航空

房產要聞

廣州樓市全線飄紅!二手增長20%,一手暴漲244.7%!

親子要聞

假性帶娃正在奶奶群體中流行,奶奶覺得盡到義務,媽媽卻很無奈

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

山東艦航母現身菲北部海域 國防部回應

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 特克斯县| 红河县| 新干县| 汝阳县| 淮南市| 新泰市| 丰顺县| 新野县| 汤阴县| 英山县| 民权县| 偏关县| 集安市| 台北市| 尉犁县| 芷江| 安康市| 昭觉县| 陆丰市| 盖州市| 澎湖县| 韩城市| 宜阳县| 肥乡县| 汶川县| 永修县| 玉田县| 军事| 黑水县| 开鲁县| 玉树县| 东源县| 大连市| 赫章县| 怀远县| 墨竹工卡县| 龙里县| 达拉特旗| 沾益县| 涞源县| 新密市|