來源:量子位
檢索增強(qiáng)生成(RAG)雖好,但一直面臨著資源消耗大、部署復(fù)雜等技術(shù)壁壘。
近日,香港大學(xué)黃超教授團(tuán)隊(duì)提出MiniRAG,成功將RAG技術(shù)的應(yīng)用門檻降至1.5B參數(shù)規(guī)模,實(shí)現(xiàn)了算力需求的大幅降低。這一突破性成果不僅為邊緣計(jì)算設(shè)備注入新活力,更開啟了基于小模型輕量級RAG的探索。
研究團(tuán)隊(duì)開發(fā)的這套MiniRAG系統(tǒng)采用小模型架構(gòu),實(shí)現(xiàn)了輕量級的檢索增強(qiáng)生成功能。通過本地部署的方式,既降低了資源消耗,又能妥善保護(hù)用戶隱私。
為驗(yàn)證系統(tǒng)在現(xiàn)實(shí)環(huán)境下的實(shí)用性,團(tuán)隊(duì)專門設(shè)計(jì)了LiHua-World評測數(shù)據(jù)集,這套數(shù)據(jù)集包含了個(gè)人通訊、信息檢索等日常應(yīng)用場景的模擬數(shù)據(jù),為小模型RAG性能評估提供了系統(tǒng)化的測試標(biāo)準(zhǔn)。
模型的性能評測評估了不同框架在遷移至小模型時(shí)的適應(yīng)能力差異:GraphRAG完全無法保持基本功能,LightRAG的表現(xiàn)銳減近半,而MiniRAG即便在輕量化后依然保持了較高水準(zhǔn),最優(yōu)情況下性能僅下降不到1%,最差情況也僅降低21%左右。值得關(guān)注的是,MiniRAG在顯著節(jié)省存儲(chǔ)空間的同時(shí)(僅需原來25%),仍能維持如此穩(wěn)定的輸出質(zhì)量。
MiniRAG架構(gòu)設(shè)計(jì)
針對傳統(tǒng)RAG系統(tǒng)過度依賴大型語言模型的問題,研究團(tuán)隊(duì)提出了新的MiniRAG框架。這一設(shè)計(jì)摒棄了依賴大模型處理復(fù)雜語義理解和多步推理的傳統(tǒng)路線,轉(zhuǎn)而構(gòu)建了一套適配小型語言模型特點(diǎn)的精簡架構(gòu)。
通過深入研究,團(tuán)隊(duì)發(fā)現(xiàn)小型語言模型雖然在復(fù)雜認(rèn)知任務(wù)上存在局限,但具有三個(gè)可供充分利用的優(yōu)勢特性:
在模式識(shí)別和局部文本處理等基礎(chǔ)任務(wù)上表現(xiàn)突出
借助結(jié)構(gòu)化信息的引入可顯著提升其語義理解能力
通過將復(fù)雜任務(wù)分解為簡單子任務(wù)的策略,能夠保證系統(tǒng)穩(wěn)定可靠運(yùn)行
基于這些發(fā)現(xiàn),研究團(tuán)隊(duì)開發(fā)了兩項(xiàng)核心技術(shù)創(chuàng)新:
異構(gòu)圖索引:優(yōu)化信息組織結(jié)構(gòu),提升檢索精確度
輕量級知識(shí)檢索:確保高效準(zhǔn)確的信息獲取
基于小模型的語義檢索機(jī)制
為突破端側(cè)智能檢索的瓶頸,MiniRAG團(tuán)隊(duì)構(gòu)建了一套全新的語義感知框架。這套系統(tǒng)將離散的文本信息與結(jié)構(gòu)化的實(shí)體知識(shí)融為一體,構(gòu)建成一張動(dòng)態(tài)感知的智能網(wǎng)絡(luò),實(shí)現(xiàn)了檢索效率的質(zhì)的飛躍。
文本語義分析:識(shí)別并存儲(chǔ)文檔中的核心要素,包括時(shí)間、地點(diǎn)、事件描述和領(lǐng)域概念
文本Chunk融合:維護(hù)原始段落的完整性,保留必要的上下文信息
這種設(shè)計(jì)讓系統(tǒng)在檢索時(shí)可以充分利用結(jié)構(gòu)化特征和原文信息。通過并行匹配策略,既提升了檢索的準(zhǔn)確度,又有效避免了小模型在語義理解上的局限性,使端側(cè)RAG應(yīng)用更加實(shí)用可靠。
輕量級知識(shí)檢索架構(gòu)
端側(cè)RAG應(yīng)用面臨著獨(dú)特的挑戰(zhàn):計(jì)算資源受限且需要保護(hù)數(shù)據(jù)隱私,這使得傳統(tǒng)的大模型方案難以落地。基于此,MiniRAG提出了一套輕量化的圖式檢索方案,通過優(yōu)化的語義分析和簡化的嵌入技術(shù),在保證效果的同時(shí)大幅降低了系統(tǒng)開銷。
檢索框架主要包含兩個(gè)關(guān)鍵設(shè)計(jì):
查詢語義映射:系統(tǒng)采用精簡的語義分析流程,專注于提取查詢中的關(guān)鍵實(shí)體和邏輯關(guān)系。這種輕量級的處理方式充分發(fā)揮了小模型在特定任務(wù)上的優(yōu)勢,確保檢索過程快速高效。
拓?fù)湓鰪?qiáng)檢索:檢索過程分為兩個(gè)環(huán)節(jié),先基于語義特征快速定位核心信息點(diǎn),再通過異質(zhì)圖結(jié)構(gòu)化的關(guān)聯(lián)分析擴(kuò)展相關(guān)內(nèi)容,實(shí)現(xiàn)準(zhǔn)確和全面的信息獲取。
這種設(shè)計(jì)既保證了檢索質(zhì)量,又很好地適應(yīng)了端側(cè)環(huán)境的資源約束。相比傳統(tǒng)方案,具有更強(qiáng)的實(shí)用性和可擴(kuò)展性。
模擬真實(shí)端側(cè)場景的評測數(shù)據(jù)集: “假如你是LiHua…”
為了更準(zhǔn)確地評估端側(cè)RAG系統(tǒng)的實(shí)際表現(xiàn),團(tuán)隊(duì)開發(fā)了一個(gè)貼近現(xiàn)實(shí)的評測數(shù)據(jù)集。這個(gè)名為LiHua-World的數(shù)據(jù)集模擬了一位普通用戶”李華”在移動(dòng)設(shè)備上產(chǎn)生的各類信息記錄,包括社交對話、運(yùn)動(dòng)日志、休閑娛樂和日程安排等豐富內(nèi)容。
數(shù)據(jù)集涵蓋了從單一信息查詢到多層次關(guān)聯(lián)分析的各類任務(wù)。通過還原移動(dòng)設(shè)備的真實(shí)使用場景,LiHua-World不僅體現(xiàn)了端側(cè)應(yīng)用的實(shí)際需求,更建立起一個(gè)完整的評測體系,為端側(cè)RAG技術(shù)的發(fā)展和優(yōu)化提供了可靠的實(shí)驗(yàn)基準(zhǔn)。
實(shí)驗(yàn)評估
團(tuán)隊(duì)通過實(shí)驗(yàn)設(shè)計(jì)對MiniRAG系統(tǒng)進(jìn)行了性能評測,重點(diǎn)關(guān)注其在端側(cè)實(shí)際應(yīng)用場景中的表現(xiàn)。評估工作主要從三個(gè)層面展開:
整體性能評估- 團(tuán)隊(duì)選取了當(dāng)前主流的移動(dòng)端RAG解決方案作為對照組,從檢索質(zhì)量、運(yùn)行效率和資源占用等維度進(jìn)行了量化對比,全面衡量系統(tǒng)的綜合表現(xiàn)
模塊效能分析:深入探索MiniRAG核心組件的性能貢獻(xiàn),包括語義感知異構(gòu)圖索引機(jī)制的檢索效果、輕量級檢索策略的計(jì)算開銷,以及各模塊間的協(xié)同效應(yīng)
實(shí)際場景案例研究:實(shí)驗(yàn)中團(tuán)隊(duì)考察系統(tǒng)處理復(fù)雜信息檢索和多步推理等高難度任務(wù)的能力。通過實(shí)際案例的詳細(xì)分析,直觀展示了MiniRAG在真實(shí)環(huán)境中的應(yīng)用價(jià)值和優(yōu)勢
性能評估結(jié)果
實(shí)驗(yàn)重點(diǎn)考察了各類RAG系統(tǒng)在適配小型語言模型(SLMs)時(shí)的表現(xiàn)差異。測試結(jié)果顯示,傳統(tǒng)方案在這一場景下普遍面臨嚴(yán)峻挑戰(zhàn):以LightRAG為例,系統(tǒng)整體效果大幅下滑,性能降幅接近一半。更令人擔(dān)憂的是,GraphRAG在小模型環(huán)境下完全喪失了基本功能。這些現(xiàn)象反映出現(xiàn)有RAG架構(gòu)過度依賴大模型的計(jì)算能力。
相較之下,MiniRAG通過優(yōu)化的圖索引設(shè)計(jì)和創(chuàng)新的檢索機(jī)制,有效地解決了這一技術(shù)瓶頸。實(shí)驗(yàn)數(shù)據(jù)令人振奮:在遷移至小型語言模型的過程中,系統(tǒng)性能最大降幅僅為兩成左右,個(gè)別任務(wù)類型的性能甚至基本保持不變(降幅不足1%)。這充分證明了MiniRAG在輕量化場景下的獨(dú)特優(yōu)勢和較強(qiáng)適應(yīng)能力。
存儲(chǔ)效率評測
經(jīng)過詳細(xì)的性能測試,MiniRAG在資源優(yōu)化方面展現(xiàn)出顯著優(yōu)勢。對比使用gpt-4-mini的LightRAG基準(zhǔn)系統(tǒng),團(tuán)隊(duì)的方案僅占用四分之一的存儲(chǔ)空間就達(dá)到了相近的性能指標(biāo)。這種顯著的存儲(chǔ)壓縮(降低約75%)并未影響系統(tǒng)的檢索質(zhì)量,說明了團(tuán)隊(duì)在架構(gòu)設(shè)計(jì)上的價(jià)值。
消融實(shí)驗(yàn)分析
團(tuán)隊(duì)制定了一套系統(tǒng)化的評測方案,旨在深入分析各核心模塊對整體性能的具體貢獻(xiàn)。評測分為兩個(gè)主要部分:
首先是索引機(jī)制測試,我們將系統(tǒng)中的異構(gòu)圖索引替換為基于語義描述的傳統(tǒng)方案(簡記為- 實(shí)驗(yàn)),這類方案與現(xiàn)有主流系統(tǒng)采用相似的處理思路,主要通過模型的語義理解來構(gòu)建實(shí)體和關(guān)系的描述表示。
其次是檢索流程測試,通過在圖檢索環(huán)節(jié)選擇性地禁用不同功能組件(簡記為- 實(shí)驗(yàn)),我們能夠準(zhǔn)確衡量每個(gè)模塊的獨(dú)立貢獻(xiàn)。這種細(xì)粒度的實(shí)驗(yàn)設(shè)計(jì)為評估創(chuàng)新組件的實(shí)際價(jià)值提供了可靠依據(jù)。
實(shí)驗(yàn)結(jié)果表明:
基于小語言模型RAG的挑戰(zhàn)。實(shí)驗(yàn)數(shù)據(jù)充分揭示了傳統(tǒng)索引方法在小模型環(huán)境下的局限性。當(dāng)我們用基于文本語義的傳統(tǒng)索引技術(shù)(- 測試)替換MiniRAG的創(chuàng)新方案時(shí),系統(tǒng)表現(xiàn)大幅衰退。這一結(jié)果印證了我們的理論推測:小型語言模型在處理復(fù)雜知識(shí)結(jié)構(gòu)和深層語義理解時(shí)確實(shí)存在天然瓶頸。
Reasoning Path Discovery的有效性。進(jìn)一步的功能模塊測試也帶來了重要發(fā)現(xiàn)。實(shí)驗(yàn)表明,無論是剔除邊際關(guān)聯(lián)信息(- )還是移除塊級節(jié)點(diǎn)(- ),都會(huì)對系統(tǒng)效果造成顯著影響。這些關(guān)鍵組件不僅通過智能路徑推理提升了查詢準(zhǔn)確度,還有效克服了小型語言模型在知識(shí)處理上的固有不足。這雙重優(yōu)勢凸顯了MiniRAG架構(gòu)設(shè)計(jì)的獨(dú)特價(jià)值。
實(shí)際案例分析
以下通過一個(gè)富有挑戰(zhàn)性的餐廳識(shí)別場景,展示MiniRAG如何在實(shí)際應(yīng)用中充分發(fā)揮其技術(shù)優(yōu)勢,尤其在處理多維度信息檢索方面的出色表現(xiàn)。
挑戰(zhàn):復(fù)雜查詢解析的困境
研究團(tuán)隊(duì)選取了一個(gè)具有挑戰(zhàn)性的測試案例,查詢內(nèi)容為:Wolfgang和Li Hua為慶祝Wolfgang升職而共進(jìn)晚餐的那家意大利餐廳叫什么名字?這一查詢涉及多重約束條件,要求系統(tǒng)能從在線聊天數(shù)據(jù)中準(zhǔn)確識(shí)別特定意大利餐廳及其相關(guān)上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型,但受限于小型語言模型的固有局限性,特別是在提取high-level信息和處理圖索引噪聲方面的不足,導(dǎo)致其檢索效果不夠理想。
MiniRAG的解決方案
MiniRAG通過其獨(dú)特的查詢引導(dǎo)推理路徑發(fā)現(xiàn)機(jī)制成功應(yīng)對了上述挑戰(zhàn)。系統(tǒng)利用異構(gòu)圖索引結(jié)構(gòu),首先預(yù)測答案類型(如”社交互動(dòng)”或”地點(diǎn)”),然后通過策略性分解查詢要素(專注于”意大利場所”和”餐廳”語境),結(jié)合目標(biāo)實(shí)體匹配,實(shí)現(xiàn)了精確且具有上下文關(guān)聯(lián)的知識(shí)檢索。這種結(jié)構(gòu)化推理方法使MiniRAG能夠精確導(dǎo)航知識(shí)空間,最終成功定位目標(biāo)餐廳——Venedia Grancaffe。
結(jié)論
MiniRAG是一款輕量級的檢索增強(qiáng)生成系統(tǒng),成功解決了小型語言模型(SLMs)在傳統(tǒng)RAG框架中的應(yīng)用限制。該系統(tǒng)采用創(chuàng)新的異構(gòu)圖索引架構(gòu)和輕量級啟發(fā)式檢索機(jī)制,有效整合了文本與圖式方法的優(yōu)勢,大幅降低了對模型能力的依賴要求。實(shí)驗(yàn)結(jié)果表明,基于SLMs的MiniRAG性能可與大語言模型方案媲美。
為促進(jìn)邊緣設(shè)備RAG技術(shù)的發(fā)展,研究團(tuán)隊(duì)同時(shí)發(fā)布了首個(gè)專門的評估基準(zhǔn)數(shù)據(jù)集,重點(diǎn)覆蓋個(gè)人通信和多約束查詢等實(shí)際應(yīng)用場景。這一研究不僅代表著端側(cè)RAG系統(tǒng)的重要突破,也為注重隱私保護(hù)和資源效率的邊緣AI應(yīng)用開創(chuàng)了新的可能。
項(xiàng)目鏈接: https://github.com/HKUDS/MiniRAG
論文鏈接: https://arxiv.org/abs/2501.06713
實(shí)驗(yàn)室主頁: https://github.com/HKUDS
蛇年大吉
紅梅傲雪報(bào)春來
喜氣洋洋迎新歲
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.