99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MiniRAG:一個(gè)極致簡潔、高效的新型RAG系統(tǒng)

0
分享至

來源:量子位

檢索增強(qiáng)生成(RAG)雖好,但一直面臨著資源消耗大、部署復(fù)雜等技術(shù)壁壘。

近日,香港大學(xué)黃超教授團(tuán)隊(duì)提出MiniRAG,成功將RAG技術(shù)的應(yīng)用門檻降至1.5B參數(shù)規(guī)模,實(shí)現(xiàn)了算力需求的大幅降低。這一突破性成果不僅為邊緣計(jì)算設(shè)備注入新活力,更開啟了基于小模型輕量級RAG的探索。


研究團(tuán)隊(duì)開發(fā)的這套MiniRAG系統(tǒng)采用小模型架構(gòu),實(shí)現(xiàn)了輕量級的檢索增強(qiáng)生成功能。通過本地部署的方式,既降低了資源消耗,又能妥善保護(hù)用戶隱私。

為驗(yàn)證系統(tǒng)在現(xiàn)實(shí)環(huán)境下的實(shí)用性,團(tuán)隊(duì)專門設(shè)計(jì)了LiHua-World評測數(shù)據(jù)集,這套數(shù)據(jù)集包含了個(gè)人通訊、信息檢索等日常應(yīng)用場景的模擬數(shù)據(jù),為小模型RAG性能評估提供了系統(tǒng)化的測試標(biāo)準(zhǔn)。


模型的性能評測評估了不同框架在遷移至小模型時(shí)的適應(yīng)能力差異:GraphRAG完全無法保持基本功能,LightRAG的表現(xiàn)銳減近半,而MiniRAG即便在輕量化后依然保持了較高水準(zhǔn),最優(yōu)情況下性能僅下降不到1%,最差情況也僅降低21%左右。值得關(guān)注的是,MiniRAG在顯著節(jié)省存儲(chǔ)空間的同時(shí)(僅需原來25%),仍能維持如此穩(wěn)定的輸出質(zhì)量。

MiniRAG架構(gòu)設(shè)計(jì)

針對傳統(tǒng)RAG系統(tǒng)過度依賴大型語言模型的問題,研究團(tuán)隊(duì)提出了新的MiniRAG框架。這一設(shè)計(jì)摒棄了依賴大模型處理復(fù)雜語義理解和多步推理的傳統(tǒng)路線,轉(zhuǎn)而構(gòu)建了一套適配小型語言模型特點(diǎn)的精簡架構(gòu)。

通過深入研究,團(tuán)隊(duì)發(fā)現(xiàn)小型語言模型雖然在復(fù)雜認(rèn)知任務(wù)上存在局限,但具有三個(gè)可供充分利用的優(yōu)勢特性:

  • 在模式識(shí)別和局部文本處理等基礎(chǔ)任務(wù)上表現(xiàn)突出

  • 借助結(jié)構(gòu)化信息的引入可顯著提升其語義理解能力

  • 通過將復(fù)雜任務(wù)分解為簡單子任務(wù)的策略,能夠保證系統(tǒng)穩(wěn)定可靠運(yùn)行

基于這些發(fā)現(xiàn),研究團(tuán)隊(duì)開發(fā)了兩項(xiàng)核心技術(shù)創(chuàng)新:

  • 異構(gòu)圖索引:優(yōu)化信息組織結(jié)構(gòu),提升檢索精確度

  • 輕量級知識(shí)檢索:確保高效準(zhǔn)確的信息獲取


基于小模型的語義檢索機(jī)制

為突破端側(cè)智能檢索的瓶頸,MiniRAG團(tuán)隊(duì)構(gòu)建了一套全新的語義感知框架。這套系統(tǒng)將離散的文本信息與結(jié)構(gòu)化的實(shí)體知識(shí)融為一體,構(gòu)建成一張動(dòng)態(tài)感知的智能網(wǎng)絡(luò),實(shí)現(xiàn)了檢索效率的質(zhì)的飛躍。

  • 文本語義分析:識(shí)別并存儲(chǔ)文檔中的核心要素,包括時(shí)間、地點(diǎn)、事件描述和領(lǐng)域概念

  • 文本Chunk融合:維護(hù)原始段落的完整性,保留必要的上下文信息

這種設(shè)計(jì)讓系統(tǒng)在檢索時(shí)可以充分利用結(jié)構(gòu)化特征和原文信息。通過并行匹配策略,既提升了檢索的準(zhǔn)確度,又有效避免了小模型在語義理解上的局限性,使端側(cè)RAG應(yīng)用更加實(shí)用可靠。

輕量級知識(shí)檢索架構(gòu)

端側(cè)RAG應(yīng)用面臨著獨(dú)特的挑戰(zhàn):計(jì)算資源受限且需要保護(hù)數(shù)據(jù)隱私,這使得傳統(tǒng)的大模型方案難以落地。基于此,MiniRAG提出了一套輕量化的圖式檢索方案,通過優(yōu)化的語義分析和簡化的嵌入技術(shù),在保證效果的同時(shí)大幅降低了系統(tǒng)開銷。
檢索框架主要包含兩個(gè)關(guān)鍵設(shè)計(jì):

  • 查詢語義映射:系統(tǒng)采用精簡的語義分析流程,專注于提取查詢中的關(guān)鍵實(shí)體和邏輯關(guān)系。這種輕量級的處理方式充分發(fā)揮了小模型在特定任務(wù)上的優(yōu)勢,確保檢索過程快速高效。

  • 拓?fù)湓鰪?qiáng)檢索:檢索過程分為兩個(gè)環(huán)節(jié),先基于語義特征快速定位核心信息點(diǎn),再通過異質(zhì)圖結(jié)構(gòu)化的關(guān)聯(lián)分析擴(kuò)展相關(guān)內(nèi)容,實(shí)現(xiàn)準(zhǔn)確和全面的信息獲取。

這種設(shè)計(jì)既保證了檢索質(zhì)量,又很好地適應(yīng)了端側(cè)環(huán)境的資源約束。相比傳統(tǒng)方案,具有更強(qiáng)的實(shí)用性和可擴(kuò)展性。

模擬真實(shí)端側(cè)場景的評測數(shù)據(jù)集: “假如你是LiHua…”

為了更準(zhǔn)確地評估端側(cè)RAG系統(tǒng)的實(shí)際表現(xiàn),團(tuán)隊(duì)開發(fā)了一個(gè)貼近現(xiàn)實(shí)的評測數(shù)據(jù)集。這個(gè)名為LiHua-World的數(shù)據(jù)集模擬了一位普通用戶”李華”在移動(dòng)設(shè)備上產(chǎn)生的各類信息記錄,包括社交對話、運(yùn)動(dòng)日志、休閑娛樂和日程安排等豐富內(nèi)容。

數(shù)據(jù)集涵蓋了從單一信息查詢到多層次關(guān)聯(lián)分析的各類任務(wù)。通過還原移動(dòng)設(shè)備的真實(shí)使用場景,LiHua-World不僅體現(xiàn)了端側(cè)應(yīng)用的實(shí)際需求,更建立起一個(gè)完整的評測體系,為端側(cè)RAG技術(shù)的發(fā)展和優(yōu)化提供了可靠的實(shí)驗(yàn)基準(zhǔn)。


實(shí)驗(yàn)評估

團(tuán)隊(duì)通過實(shí)驗(yàn)設(shè)計(jì)對MiniRAG系統(tǒng)進(jìn)行了性能評測,重點(diǎn)關(guān)注其在端側(cè)實(shí)際應(yīng)用場景中的表現(xiàn)。評估工作主要從三個(gè)層面展開:

  • 整體性能評估- 團(tuán)隊(duì)選取了當(dāng)前主流的移動(dòng)端RAG解決方案作為對照組,從檢索質(zhì)量、運(yùn)行效率和資源占用等維度進(jìn)行了量化對比,全面衡量系統(tǒng)的綜合表現(xiàn)

  • 模塊效能分析:深入探索MiniRAG核心組件的性能貢獻(xiàn),包括語義感知異構(gòu)圖索引機(jī)制的檢索效果、輕量級檢索策略的計(jì)算開銷,以及各模塊間的協(xié)同效應(yīng)

  • 實(shí)際場景案例研究:實(shí)驗(yàn)中團(tuán)隊(duì)考察系統(tǒng)處理復(fù)雜信息檢索和多步推理等高難度任務(wù)的能力。通過實(shí)際案例的詳細(xì)分析,直觀展示了MiniRAG在真實(shí)環(huán)境中的應(yīng)用價(jià)值和優(yōu)勢


性能評估結(jié)果

實(shí)驗(yàn)重點(diǎn)考察了各類RAG系統(tǒng)在適配小型語言模型(SLMs)時(shí)的表現(xiàn)差異。測試結(jié)果顯示,傳統(tǒng)方案在這一場景下普遍面臨嚴(yán)峻挑戰(zhàn):以LightRAG為例,系統(tǒng)整體效果大幅下滑,性能降幅接近一半。更令人擔(dān)憂的是,GraphRAG在小模型環(huán)境下完全喪失了基本功能。這些現(xiàn)象反映出現(xiàn)有RAG架構(gòu)過度依賴大模型的計(jì)算能力。

相較之下,MiniRAG通過優(yōu)化的圖索引設(shè)計(jì)和創(chuàng)新的檢索機(jī)制,有效地解決了這一技術(shù)瓶頸。實(shí)驗(yàn)數(shù)據(jù)令人振奮:在遷移至小型語言模型的過程中,系統(tǒng)性能最大降幅僅為兩成左右,個(gè)別任務(wù)類型的性能甚至基本保持不變(降幅不足1%)。這充分證明了MiniRAG在輕量化場景下的獨(dú)特優(yōu)勢和較強(qiáng)適應(yīng)能力。


存儲(chǔ)效率評測

經(jīng)過詳細(xì)的性能測試,MiniRAG在資源優(yōu)化方面展現(xiàn)出顯著優(yōu)勢。對比使用gpt-4-mini的LightRAG基準(zhǔn)系統(tǒng),團(tuán)隊(duì)的方案僅占用四分之一的存儲(chǔ)空間就達(dá)到了相近的性能指標(biāo)。這種顯著的存儲(chǔ)壓縮(降低約75%)并未影響系統(tǒng)的檢索質(zhì)量,說明了團(tuán)隊(duì)在架構(gòu)設(shè)計(jì)上的價(jià)值。

消融實(shí)驗(yàn)分析

團(tuán)隊(duì)制定了一套系統(tǒng)化的評測方案,旨在深入分析各核心模塊對整體性能的具體貢獻(xiàn)。評測分為兩個(gè)主要部分:

首先是索引機(jī)制測試,我們將系統(tǒng)中的異構(gòu)圖索引替換為基于語義描述的傳統(tǒng)方案(簡記為- 實(shí)驗(yàn)),這類方案與現(xiàn)有主流系統(tǒng)采用相似的處理思路,主要通過模型的語義理解來構(gòu)建實(shí)體和關(guān)系的描述表示。

其次是檢索流程測試,通過在圖檢索環(huán)節(jié)選擇性地禁用不同功能組件(簡記為- 實(shí)驗(yàn)),我們能夠準(zhǔn)確衡量每個(gè)模塊的獨(dú)立貢獻(xiàn)。這種細(xì)粒度的實(shí)驗(yàn)設(shè)計(jì)為評估創(chuàng)新組件的實(shí)際價(jià)值提供了可靠依據(jù)。


實(shí)驗(yàn)結(jié)果表明:

基于小語言模型RAG的挑戰(zhàn)。實(shí)驗(yàn)數(shù)據(jù)充分揭示了傳統(tǒng)索引方法在小模型環(huán)境下的局限性。當(dāng)我們用基于文本語義的傳統(tǒng)索引技術(shù)(- 測試)替換MiniRAG的創(chuàng)新方案時(shí),系統(tǒng)表現(xiàn)大幅衰退。這一結(jié)果印證了我們的理論推測:小型語言模型在處理復(fù)雜知識(shí)結(jié)構(gòu)和深層語義理解時(shí)確實(shí)存在天然瓶頸。

Reasoning Path Discovery的有效性。進(jìn)一步的功能模塊測試也帶來了重要發(fā)現(xiàn)。實(shí)驗(yàn)表明,無論是剔除邊際關(guān)聯(lián)信息(- )還是移除塊級節(jié)點(diǎn)(- ),都會(huì)對系統(tǒng)效果造成顯著影響。這些關(guān)鍵組件不僅通過智能路徑推理提升了查詢準(zhǔn)確度,還有效克服了小型語言模型在知識(shí)處理上的固有不足。這雙重優(yōu)勢凸顯了MiniRAG架構(gòu)設(shè)計(jì)的獨(dú)特價(jià)值。

實(shí)際案例分析

以下通過一個(gè)富有挑戰(zhàn)性的餐廳識(shí)別場景,展示MiniRAG如何在實(shí)際應(yīng)用中充分發(fā)揮其技術(shù)優(yōu)勢,尤其在處理多維度信息檢索方面的出色表現(xiàn)。

挑戰(zhàn):復(fù)雜查詢解析的困境

研究團(tuán)隊(duì)選取了一個(gè)具有挑戰(zhàn)性的測試案例,查詢內(nèi)容為:Wolfgang和Li Hua為慶祝Wolfgang升職而共進(jìn)晚餐的那家意大利餐廳叫什么名字?這一查詢涉及多重約束條件,要求系統(tǒng)能從在線聊天數(shù)據(jù)中準(zhǔn)確識(shí)別特定意大利餐廳及其相關(guān)上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型,但受限于小型語言模型的固有局限性,特別是在提取high-level信息和處理圖索引噪聲方面的不足,導(dǎo)致其檢索效果不夠理想。

MiniRAG的解決方案

MiniRAG通過其獨(dú)特的查詢引導(dǎo)推理路徑發(fā)現(xiàn)機(jī)制成功應(yīng)對了上述挑戰(zhàn)。系統(tǒng)利用異構(gòu)圖索引結(jié)構(gòu),首先預(yù)測答案類型(如”社交互動(dòng)”或”地點(diǎn)”),然后通過策略性分解查詢要素(專注于”意大利場所”和”餐廳”語境),結(jié)合目標(biāo)實(shí)體匹配,實(shí)現(xiàn)了精確且具有上下文關(guān)聯(lián)的知識(shí)檢索。這種結(jié)構(gòu)化推理方法使MiniRAG能夠精確導(dǎo)航知識(shí)空間,最終成功定位目標(biāo)餐廳——Venedia Grancaffe。


結(jié)論

MiniRAG是一款輕量級的檢索增強(qiáng)生成系統(tǒng),成功解決了小型語言模型(SLMs)在傳統(tǒng)RAG框架中的應(yīng)用限制。該系統(tǒng)采用創(chuàng)新的異構(gòu)圖索引架構(gòu)和輕量級啟發(fā)式檢索機(jī)制,有效整合了文本與圖式方法的優(yōu)勢,大幅降低了對模型能力的依賴要求。實(shí)驗(yàn)結(jié)果表明,基于SLMs的MiniRAG性能可與大語言模型方案媲美。

為促進(jìn)邊緣設(shè)備RAG技術(shù)的發(fā)展,研究團(tuán)隊(duì)同時(shí)發(fā)布了首個(gè)專門的評估基準(zhǔn)數(shù)據(jù)集,重點(diǎn)覆蓋個(gè)人通信和多約束查詢等實(shí)際應(yīng)用場景。這一研究不僅代表著端側(cè)RAG系統(tǒng)的重要突破,也為注重隱私保護(hù)和資源效率的邊緣AI應(yīng)用開創(chuàng)了新的可能。

項(xiàng)目鏈接: https://github.com/HKUDS/MiniRAG
論文鏈接: https://arxiv.org/abs/2501.06713
實(shí)驗(yàn)室主頁: https://github.com/HKUDS


蛇年大吉


紅梅傲雪報(bào)春來


喜氣洋洋迎新歲


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
566萬!冠軍前鋒確認(rèn)加盟快船,哈登超級興奮,最新首發(fā)五虎曝光

566萬!冠軍前鋒確認(rèn)加盟快船,哈登超級興奮,最新首發(fā)五虎曝光

山河入畫屏
2025-07-04 07:02:22
打滿82場!40歲想出任首發(fā)~Shams:保羅昨天和雄鹿官員進(jìn)行了交流

打滿82場!40歲想出任首發(fā)~Shams:保羅昨天和雄鹿官員進(jìn)行了交流

直播吧
2025-07-04 09:15:05
女孩嫁印度20年沒回中國,父親退休后去探望,見到女婿后原地痛哭

女孩嫁印度20年沒回中國,父親退休后去探望,見到女婿后原地痛哭

黃家湖的憂傷
2025-06-30 17:29:00
蔣大為的經(jīng)紀(jì)人姚曼爆料:我是蔣大為的情人蔣大為:我是被逼的!

蔣大為的經(jīng)紀(jì)人姚曼爆料:我是蔣大為的情人蔣大為:我是被逼的!

霹靂炮
2025-07-03 22:57:49
荒誕魔幻的氛圍下,大惡之人為何不被人提及?

荒誕魔幻的氛圍下,大惡之人為何不被人提及?

吳女士
2025-07-02 03:57:17
“不能讓李嘉誠跑了!”中方這回下了死命令,有一道口子決不能開

“不能讓李嘉誠跑了!”中方這回下了死命令,有一道口子決不能開

科技處長
2025-04-30 18:29:56
韓紅撞臉Labubu玩偶,本人認(rèn)證:這太像了!

韓紅撞臉Labubu玩偶,本人認(rèn)證:這太像了!

紅星新聞
2025-07-03 16:21:21
小米又一重大突破!自研車規(guī)級紙巾盒!

小米又一重大突破!自研車規(guī)級紙巾盒!

電動(dòng)知家
2025-07-03 15:30:32
周杰倫去周星馳豪宅做客,腳下足球搶鏡,二人喝茶聊天,開懷大笑

周杰倫去周星馳豪宅做客,腳下足球搶鏡,二人喝茶聊天,開懷大笑

檸檬有娛樂
2025-07-03 13:14:52
KTV陪酒女生都是啥樣?網(wǎng)友:女性陰暗一面在里面得到無限釋放

KTV陪酒女生都是啥樣?網(wǎng)友:女性陰暗一面在里面得到無限釋放

解讀熱點(diǎn)事件
2025-07-02 00:15:02
由于NBA收入低于預(yù)期,24-25賽季每位球員僅能拿到合同總額的90.9%

由于NBA收入低于預(yù)期,24-25賽季每位球員僅能拿到合同總額的90.9%

雷速體育
2025-07-03 20:06:12
南航機(jī)長妻子:他做貢獻(xiàn),但家屬連最后一眼和是否搶救都不知道

南航機(jī)長妻子:他做貢獻(xiàn),但家屬連最后一眼和是否搶救都不知道

昨夜軍帖
2025-07-03 08:27:27
2024年,我國人均GDP降至全球第73名,那美、俄、印、日等國呢?

2024年,我國人均GDP降至全球第73名,那美、俄、印、日等國呢?

南生今世說
2025-07-04 03:14:33
許亞軍一家三口樂山旅游!16歲兒子身高近1米8,妻子張澍白到發(fā)光

許亞軍一家三口樂山旅游!16歲兒子身高近1米8,妻子張澍白到發(fā)光

小嵩
2025-07-03 22:05:54
德媒:中國在北約家門口展示海軍實(shí)力

德媒:中國在北約家門口展示海軍實(shí)力

青木在德國
2025-07-02 21:41:51
僅播6集就口碑大爆,評分高達(dá)9.2,這才是國產(chǎn)黑馬劇該有的樣子

僅播6集就口碑大爆,評分高達(dá)9.2,這才是國產(chǎn)黑馬劇該有的樣子

夢涵說體育
2025-07-03 08:53:57
曹德旺高估了福耀科技大學(xué),福耀科技大學(xué)高估了王樹國

曹德旺高估了福耀科技大學(xué),福耀科技大學(xué)高估了王樹國

前沿天地
2025-07-04 04:49:01
雷軍:所有同行投入測試的規(guī)模至少離小米差3到5倍!小米:嚴(yán)禁以任何形式詆毀競品

雷軍:所有同行投入測試的規(guī)模至少離小米差3到5倍!小米:嚴(yán)禁以任何形式詆毀競品

大白聊IT
2025-07-03 18:13:26
震驚!網(wǎng)傳成都某廣場發(fā)提醒卡片,要警惕同性戀,提倡要子孫滿堂

震驚!網(wǎng)傳成都某廣場發(fā)提醒卡片,要警惕同性戀,提倡要子孫滿堂

明月雜談
2025-07-03 13:00:09
大瓜!李天一豪賭輸千萬,夢鴿被限制出境,86歲李雙江被坑慘了?

大瓜!李天一豪賭輸千萬,夢鴿被限制出境,86歲李雙江被坑慘了?

烏娛子醬
2025-07-02 17:57:54
2025-07-04 09:59:00
人工智能研究 incentive-icons
人工智能研究
分享深度學(xué)習(xí)、CV、NLP
275文章數(shù) 130關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)再創(chuàng)新高,市值已逼近4萬億美元

頭條要聞

烏方"紅軍村"被俄軍集11萬兵力猛攻 俄方戰(zhàn)報(bào)泄露天機(jī)

頭條要聞

烏方"紅軍村"被俄軍集11萬兵力猛攻 俄方戰(zhàn)報(bào)泄露天機(jī)

體育要聞

你永不獨(dú)行!球迷前往安菲爾德悼念若塔

娛樂要聞

森林北又有緋聞傳出?汪峰毫不在意?

財(cái)經(jīng)要聞

闖禍電芯商部分產(chǎn)線停產(chǎn)!羅馬仕通知停工

汽車要聞

6.5秒破百 長安第三代UNI-V有更強(qiáng)2.0T

態(tài)度原創(chuàng)

教育
數(shù)碼
親子
健康
公開課

教育要聞

考大學(xué)選城市:京滬寧漢蓉,杭深蘇穗鎬,這10個(gè)城市為什么香?

數(shù)碼要聞

董明珠領(lǐng)導(dǎo)行業(yè)枝繁葉茂!格力:若不是我們撐住市場 空調(diào)行業(yè)早卷廢了

親子要聞

這個(gè)怎么搖晃也不撒落的玩具太懂媽媽了

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 宁南县| 龙井市| 门头沟区| 嵩明县| 宁津县| 高尔夫| 娱乐| 龙泉市| 大英县| 闻喜县| 阳城县| 克什克腾旗| 长葛市| 额济纳旗| 丽江市| 仪征市| 灵川县| 五峰| 郓城县| 长白| 岳池县| 汶川县| 吴川市| 乐陵市| 乐亭县| 屯留县| 清水县| 南部县| 通城县| 吉安县| 宁阳县| 盐城市| 伊通| 广宁县| 齐齐哈尔市| 禄丰县| 清新县| 长丰县| 华坪县| 泗阳县| 历史|