來源:2024年度城市金融服務優秀案例征集活動
獲獎單位:杭州銀行
榮獲獎項:數字金融創新優秀案例
一、項目背景及目標
銀行規章制度是銀行正常運作的重要基礎。隨著金融科技的迅猛發展,銀行業務日益復雜,法律法規、內部政策、合規要求也在不斷更新。銀行及金融機構的合規部門、審計部門等,都需要快速檢索和獲取相關的制度和政策信息,同時也面臨來自監管機構的嚴格合規要求,對于能夠實時更新法規和政策信息,確保合規性、高效的信息檢索,提高工作效率,降低人為錯誤的制度管理和檢索系統的需求日益增加。
在整個金融監管加強、金融合規嚴控的政策背景下,銀行需要建立健全合規管理體系,確保遵循相關法律法規。隨著信息技術的發展,尤其是大數據和人工智能應用如大語言模型的出現,為銀行制度知識庫檢索系統的建設提供了技術支持。越來越多的金融機構開始重視信息化建設,尤其是在合規和風險管理領域,推動了市場對制度管理和檢索系統的需求。在這個大背景下,杭州銀行圍繞“二二五五”戰略和“數智賦能”建設,銀行制度知識庫檢索項目開始受到重視并立項。
對于我行的制度知識庫檢索項目,有四大項目目標:
①系統目標:建立一個高效、智能、可擴展的銀行制度檢索系統,提升信息檢索效率;
②業務目標:降低各大業務機構及部門在日常運營中對于制度知識的檢索成本,減少因信息不對稱、不全面帶來的合規風險;
③技術目標:實現高可用性、高安全性和高擴展性的檢索系統和文檔管理中臺,滿足不斷變化的政策及用戶需求;
④用戶目標:提升用戶的工作效率和決策能力,提供優質的用戶體驗。
二、項目/策略方案
整個項目策劃包括以下幾點:項目目標、需求分析、項目范圍。
(1)項目目標
① 建立一套完備的銀行制度知識庫,提供便捷的檢索服務;
② 實現高效的信息管理與知識共享,支持銀行內部及外部的政策法規合規。
(2)需求分析
① 用戶需求:明確用戶(合規部門、審計部門、其他工作人員等)的檢索需求和使用場景;
② 數據源分析:確認知識庫所需的數據源,包括法規條款文件、外部政策文件、行業指南以及操作手冊等。
(3)項目范圍
包括知識庫的構建、數據處理與管理、檢索系統和管理平臺的開發、用戶界面的設計等。
整個項目實施包括以下幾個階段:數據處理與整合、系統設計、開發與測試、上線與培訓。
(1)數據處理與整合
① 根據各部門提供的行內制度、法規、政策及相關文檔,進行分部門分類別(
excel/doc/pdf/markdown/html/ofd等)的標準化及定制化處理;
② 建立數據更新機制,確保知識庫信息的時效性。
(2)系統設計
① 確定系統的整體架構,包括前端用戶界面、后端數據存儲與處理模塊;
② 設計端到端的算法模型,建立向量存儲知識庫,支持語義搜索,實體硬過濾,大模型生成式對話以及其他多模態識別等功能。
(3)開發與測試
① 前后端開發:用戶友好的文檔中臺界面開發,確保易用性。建立數據庫,實現數據存儲和文檔管理模塊;
② 算法模型開發:包括知識圖譜的構建、圖譜鏈路的檢索、query拓展、文檔OCR標注與上下文語義的切分、多重檢索鏈路召回邏輯、重排模型優化、多模態大小模型協同優化等;
③ 測試:進行功能性測試、性能測試和安全性測試。
(4)上線與培訓
① 系統上線,通過行內微課進行線上+線下的初步推廣;
② 針對業務運營管理員進行培訓,確保用戶能夠有效使用系統。
三、創新點
該項目的創新點主要體現在以下四個方面:
①采用大模型+RAG技術:本項目引入了先進的垂直金融零售領域基座模型——金磐大模型與RAG(Retrieval-Augmented Generation 檢索增強生成)框架,實現了端到端的模型開發與優化,包括文檔切分、query改寫、搜索匹配、向量庫存儲等,有效緩解了大模型在生成過程中可能出現的幻覺現象,確保生成內容的準確性和相關性,從而大大提高了模型的可靠性。
②采用知識圖譜技術: 銀行制度知識需要跨部門跨知識庫的解決方案,現有的RAG方法往往依賴簡單的數據結構,限制了它們理解基于實體間復雜關系信息的能力。并且這些系統往往缺乏必要的上下文知識,無法在不同實體及其相互關系之間保持回答的連貫性。我們基于GraphRag的思想構建了杭銀制度圖譜,將圖結構納入文本索引和信息檢索中,并在圖構建上做了剪枝優化,以及圖問答的意圖識別和多實體路徑搜索,保證了對多跳復雜問題更有效的推理和召回。
③ 采用多模態大小模型協同技術: 銀行業的制度文檔類型不光格式多樣,內容也很復雜,通常將文本、表格和圖片組合在一起,以傳達豐富的想法和見解。雖然RAG擅長理解長文本,但難以有效的集成和理解多模態內容。我們將主流的多模態大模型和小模型(包括Clip、Sam等)相結合,能夠更高效準確的分類和理解流程圖、掃描發票、大型表格等模態,實現精準問答。
④文檔數據管理中臺:本項目開發了一款專為開發與運維人員設計的文檔數據管理中臺,該平臺對文檔的整個生命周期進行了系統化管理,不僅提升了文檔的組織性和可訪問性,還確保了信息的及時更新和準確性。此外,中臺還可以為各個部門和業務條線量身定制專屬的多層次文檔集群,以滿足不同部門個性化需求,根據自身的業務特點和操作流程,快速獲取所需信息,提升各類文檔在存儲、檢索方面的便利性。
四、項目過程管理
前期階段:進行立項需求分析,以全面理解項目目標和用戶需求。在此基礎上,團隊開展需求對齊工作,確保所有相關方對項目的愿景、范圍和預期成果達成一致。這一階段的深入研究為后續工作打下堅實基礎。
中期階段:進入策劃實施階段,包括技術方法調研、產品設計、技術準備和項目開發測試。通過市場調研和技術分析,制定合理的實施方案。在產品設計過程中,重點考慮用戶體驗與功能需求,以確保知識庫的易用性和高效性。技術準備設計基礎設施的答案和相關工具的選擇,確保項目開發的順利進行。在項目開發和測試環節,制定開發與測試計劃,嚴格按照計劃進行功能點開發,進行多輪測試以驗證系統的穩定性和可靠性。
后期階段:項目的最后階段包括系統上線、用戶培訓和后續運營。在系統上線前,確保所有功能正常運行,并進行必要的調試。上線后,組織用戶培訓,以幫助用戶快速掌握系統操作,提升使用效率。此外,后期的運營維護會持續關注用戶反饋,構建數字看板,跟進系統數據指標,及時優化系統,確保知識庫的長效運行和不斷改進。
五、運營情況
在推廣方面,采取了多種策略以確保制度知識庫檢索系統的廣泛應用。首先,線上錄制系統使用的視頻課程通過公司的內部渠道推廣至全行,使用戶能夠便利的學習相關知識。此外,我們還組織線下培訓合成,以便于面對面的交流和互動,幫助用戶更好的理解和應用系統。為了增強使用文檔的可見性,我們在工作溝通APP中發布公告,鼓勵用戶積極查閱和使用相關文檔,從而提高整體使用效率。
在用戶反饋方面,為了及時收集用戶的意見和建議,我們設置了“點踩”按鈕,方便用戶對內容進行快速反饋,這一功能不僅能幫助我們了解哪些部分存在問題,還能引導我們進行改進。同時,我們對用戶的query進行算法建模分析,以識別常見需求和潛在問題,從中提取有價值的信息,幫助我們更好的理解用戶需求。
在系統運行方面,將用戶活躍量作為重要指標進行分析,評估系統的使用效果和用戶參與度。同時,我們還開發了一套問題回溯機制,確保能夠快速的定為問題,保證系統穩定運行。
六、項目成效
銀行制度知識庫檢索系統為銀行內部各部門(如合規部門、審計部門等)以及行內其他人員提供服務,帶來的成效具體體現在以下幾個方面:
①提升工作效率:通過集中管理和快速檢索各類制度和政策文件,員工可以迅速獲取所需信息,減少了查找資料所耗費的時間。這種效率的提升將直接影響工作進度,使得各部門能夠更快的完成任務,提高整體生產力。
②促進知識共享與傳承:制度知識庫能夠有效記錄和分享內部經驗和知識,避免信息孤島現象,提升行內的知識管理能力。這不僅促進了部門間的協作,也能幫助新員工快速上手,從而節省培訓成。
③降低合規風險:合規部門能夠更有效的訪問最新的法律法規和內部政策,從而降低因信息滯后導致的合規風險。及時了解和遵循相關規定,可以減少因違規操作而造成的潛在罰款和法律責任。
七、經驗總結
項目經驗總結主要體現在以下幾個方面:
首先,深入了解項目需求相當重要。在項目啟動階段,與相關方進行充分溝通,明確期望和需求,制定科學合理的開發計劃。這一過程可以有效減少重復開發或廢棄功能的發生,從而避免開發資源的浪費,提高項目的整體效率。
其次,在技術調研方面,對開源產品進行全面測試,充分了解這些產品的適用性和穩定性,避免后期出現不適用的情況,導致額外的遷移成本和資源浪費。
最后,在推廣方面,將項目嵌入用戶最常見的應用程序中,能夠有效降低用戶的使用門檻。這種策略不僅能夠提高用戶的接受度,還能促進更廣泛的使用,從而提升項目的價值。通過優化用戶體驗,確保用戶能夠無縫的訪問新功能,可以最大限度的發揮項目的潛力,實現預期目標。
更多金融科技案例和金融數據智能優秀解決方案,請在數字金融創新知識服務平臺-金科創新社案例庫、選型庫查看。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.