升級AI戰略后的OceanBase迎來了首次開發者大會。5月17日在OceanBase第三屆開發者大會上,OceanBase發布面向AI的應用產品PowerRAG,該產品提供開箱即用的RAG應用開發能力,是OceanBase面向AI時代的探索之一。作為AI戰略一號位、CTO楊傳輝表示,OceanBase正致力于構建Data×AI能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。此前,CEO楊冰曾通過全員信宣布公司全面進入AI時代。
螞蟻集團CTO何征宇在大會現場表示,螞蟻集團將支持OceanBase在金融、醫療、生活等螞蟻AI的核心場景的突破,支持OceanBase去實踐DataxAI的理念和架構創新。同時繼續支持OceanBase開源開放,把在Data×AI上的能力逐漸開放給行業,為AGI的夢想添磚加瓦。
從一體化數據庫向一體化數據底座演進
AI時代帶來了新的數據難題,已成為行業共識。IDC報告指出,受生成式AI等技術驅動,預計2028年全球新生成數據量規模將達到393.9ZB,其中企業數據規模和增速尤為凸顯。于企業而言,數據倉庫的容量已實現質的飛躍,結構化數據存儲規模“突破PB級邁向EB級”成為新常態,這給數據存儲、管理與分析帶來嚴峻挑戰。
螞蟻集團CTO何征宇也在分享中指出,海量的互聯網數據成就了今天的大模型,但大模型幻覺問題的源頭也是數據問題。數據決定著大模型的能力上限,且依舊有四大挑戰:一是數據的獲取成本顯著增加,二是嚴謹的行業數據稀缺且流動困難,三是多模態數據需要更強的處理能力,四是數據的質量評估難。
面對行業的真實需求,OceanBase正在大膽探索。楊傳輝認為,作為一個一體化分布式數據庫,OceanBase已經具備了一定的AI時代數據處理能力,如分布式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。但大模型落地產生價值的核心在于數據與模型的一體化融合,這也是OceanBase提出的構建Data×AI能力的關鍵。
基于這一能力,OceanBase致力于從一個一體化數據庫向一個一體化數據底座演進,通過一套引擎同時支持TP/AP/AI混合負載,支持向量數據庫,實現SQL與AI的混合檢索,這背后涉及OceanBase在Data與AI領域的工程與產品能力。
PowerRAG發布,提供開箱即用的RAG應用開發能力
在楊傳輝描繪的一體化數據底座版圖中,OceanBase期望在未來實現從算力、基礎設施,到平臺層、應用層、交付形態的全方位布局。
此次大會上,OceanBase首次發布面向AI的應用產品PowerRAG,打造AI驅動的開箱即用的RAG服務。
楊傳輝介紹,傳統RAG應用常用開發模式包括組件森林開發模式、RAG平臺模式等,但存在開發周期長、維護成本高、灰箱調試困難、性能難以優化等問題。
OceanBase PowerRAG提供開箱即用的RAG應用開發能力,打通應用開發數據層、平臺層、接口層與應用層的全流程,提供Document(文檔)和 Chat(對話)兩個核心API接口,幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。
“致力于成為AI時代的一體化數據底座,PowerRAG是OceanBase在應用層面探索的第一步,未來還將在應用層面、平臺層面不斷突破。”楊傳輝表示。
記者還了解到,過去十五年OceanBase誕生于雙11的海量交易場景并在螞蟻集團的金融場景中經受磨礪打磨技術,未來,螞蟻集團也將繼續向OceanBase開放核心AI場景,幫助OceanBase進一步攻堅AI關鍵能力,實現開放開源,為行業提供更多的AI創新服務。
向量性能已達開源向量數據庫業內的領先水平
作為原生分布式數據庫,OceanBase原本就具有的企業級分布式數據庫能力為AI時代的海量數據處理分析打下基礎。在支持AI應用落地的核心基礎設施——向量性能、混合檢索等層面,OceanBase也在持續探索,進一步加強SQL+AI能力。
大會現場,基于基準測試工具VectorDBBench,采用Performamce768D1M測試數據集,OceanBase與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示,OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。
面對AI時代的海量數據,OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場景的內存需求;引入針對JSON半結構化數據的壓縮能力,降低AI場景中的半結構化數據存儲成本。根據測試結果,在同等召回率與性能的情況下,引入BQ量化算法能夠實現內存成本較引入前降低 95%,而在TPC-H 10G數據集上,OceanBase的JSON壓縮比可達 MongoDB 的3倍。
此外,OceanBase已具備面向多種數據模型的混合檢索能力。在最新版本中,OceanBase混合檢索性能進一步增強,通過豐富的執行策略、自研的向量算法庫、內核級多模混合查詢等實現更快、更準、更易用的混合檢索。
目前,OceanBase已被客戶應用于多個AI相關場景的開發,如聯通軟研院基于OceanBase打造AI助手,in銀泰商業則基于OceanBase打造零售業智能問數平臺等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.