過去十五年來,誕生于“雙11”海量交易場景的OceanBase,在螞蟻集團的金融場景中不斷磨礪打磨技術,并曾打破Oracle保持9年之久的世界紀錄。2025年5月17日,OceanBase迎來新動態。當天,OceanBase舉辦了升級AI戰略后的首次開發者大會,同時也是OceanBase的第三屆開發者大會。
會上,OceanBase CTO楊傳輝回憶道:“OceanBase從螞蟻集團獨立出來之后已被用于全球2000多家企業。其中,第一家金融行業客戶是南京銀行,第一家證券行業客戶是招商證券,第一家保險行業客戶是中國人保,第一家非金融行業客戶是中國移動,第一家教育行業客戶是科大訊飛,第一家餐飲行業客戶是海底撈,第一家智造行業客戶是理想汽車,第一家出行行業客戶是T3出行,第一家物流行業客戶是德邦物流,第一家海外客戶是GCash。”
而在AI發展的時代背景之下,不久之前OceanBase CEO楊冰通過全員信宣布公司全面進入AI時代,為此OceanBase 將努力實現數據與AI的融合,打造“DATA×AI”核心能力,建設AI時代的數據底座。距離上述全員信發布不到一個月,本次會上公布了該公司的更多AI動態——既發布了數款產品,也重申了OceanBase在AI時代背景下的使命和愿景。
發布PowerRAG,提供開箱即用的RAG應用開發能力
會上,OceanBase首次發布面向AI的應用產品PowerRAG,該產品提供開箱即用的RAG應用開發能力,能夠提供AI驅動的開箱即用的RAG服務,是OceanBase面向AI時代的探索之一。
楊傳輝介紹稱,傳統RAG應用的常用開發模式包括組件森林開發模式、RAG平臺模式等,這些模式存在開發周期長、維護成本高、灰箱調試困難、性能難以優化等問題。OceanBase PowerRAG提供開箱即用的RAG應用開發能力,打通應用開發數據層、平臺層、接口層與應用層的全流程,提供Document(文檔)和 Chat(對話)兩個核心API接口,幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。
楊傳輝進一步表示,PowerRAG是OceanBase在應用層面探索的第一步,未來還將在應用層面、平臺層面不斷突破,并致力于成為AI時代的一體化從,以便應對生成式AI給數據基礎設施帶來的技術挑戰。其中,數據底座指的是通過一體化的產品、一體化的引擎,同時地處理OLTP、OLAP以及AI的混合負載。
向量性能達業內領先水平,并已實現規模化落地
大會現場,基于基準測試工具VectorDBBench,OceanBase采用Performamce768D1M測試數據集,與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示,OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。“通過這次跑分測試可以看到OceanBase的向量性能已經達到了開源向量數據庫業內領先的水平,并且比其他的主流開源向量數據庫都要好不少。”楊傳輝表示。
面對AI時代的海量數據,OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場景的內存需求;引入針對JSON半結構化數據的壓縮能力,降低AI場景中的半結構化數據存儲成本。根據測試結果,在同等召回率與性能的情況下,引入BQ量化算法能夠實現內存成本較引入前降低 95%,而在TPC-H 10G數據集上,OceanBase的JSON壓縮比可達 MongoDB 的3倍。
此外,OceanBase已具備面向多種數據模型的混合檢索能力。在最新版本中,OceanBase混合檢索性能進一步增強,通過豐富的執行策略、自研的向量算法庫、內核級多模混合查詢等實現更快、更準、更易用的混合檢索。
目前,OceanBase的向量數據庫已經得到上百家客戶的使用,并已實現規模化的落地。比如,聯通軟研院基于OceanBase打造了AI助手,in銀泰商業則基于OceanBase打造了零售業智能問數平臺。
推出“共享存儲”,實現TP場景下穩定運行對象存儲
為了解決無共享架構在彈性和成本方面的瓶頸問題,OceanBase宣布一體化架構再升級,并在本次會上推出了“共享存儲”產品,該產品能將計算與存儲解耦,以自研一體化架構實現對對象存儲(如Amazon S3、阿里云OSS等)的深度支持。
該產品還能實現對象存儲與事務型數據庫(TP,Transactional Processing)的深度集成,所構建的存算一體與分離的多云原生架構,不僅大幅提升云上數據存儲的彈性擴展能力,更使TP負載的存儲成本最高降低50%。
據悉,“共享存儲”產品在云上可被應用于多種業務場景,包括典型TP、歷史庫及備份庫,時序類業務、HBase兼容類業務、流水型業務系統、OLAP業務等。
楊傳輝進一步介紹稱,“共享存儲”產品背后蘊含著OceanBase的多項技術突破:一是構建多級緩存架構,有效解決對象存儲的訪問延遲問題;二是自研基于對象存儲的 LSM-Tree引擎并采用深度工程手段,降低對象存儲的I/O壓力;三是通過獨有的持久化緩存彈性伸縮,進一步解決TP場景下熱點數據的穩定性問題;此外,優化對象存儲的訪問全鏈路,確保TP業務毫秒級響應的穩定性。
通過逐一突破這些技術難點,使得OceanBase的云數據庫OB Cloud成為目前業內唯一能夠在 TP 場景下穩定運行對象存儲的多云原生數據庫:在TP負載下,存儲成本最高降低50%;在AP負載下,存儲成本最高可降低為原來的1/10。
與此同時,OceanBase還宣布,OB Cloud正式上線百度云。截止目前,OB Cloud已支持阿里云、華為云、騰訊云、百度云、AWS、Google Cloud 六大主流公有云平臺,全球覆蓋超過100個可用區。
承接AI時代使命:從一體化數據庫向一體化數據底座演進
IDC軟件市場研究經理李凌霄在本次會上表示,預計到2028年全球企業級數據的數據量相比2023年整體增長400%以上,年復合增長率約為30.2%。通過生成式AI技術去讓多模態數據產生價值已經具備技術可行性,這意味著多模態數據將能為企業的管理、運營、決策、業務帶來價值。未來,人們將會大量地產生、存儲和加工多模態數據。
與此同時,AI時代也帶來了新的數據難題。于企業而言,數據倉庫的容量已實現質的飛躍,結構化數據存儲規模“突破PB級邁向EB級”成為新常態,這給數據存儲、管理與分析帶來嚴峻挑戰。
面對行業需求,OceanBase正在大膽探索。楊傳輝表示,OceanBase已經具備了一定的AI時代數據處理能力,如分布式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。但大模型落地產生價值的核心在于數據與模型的一體化融合,這也是OceanBase提出的構建Data×AI能力的關鍵。
基于這一能力,OceanBase致力于從一體化數據庫向一體化數據底座演進,通過一套引擎同時支持TP/AP/AI混合負載,支持向量數據庫,實現SQL與AI的混合檢索。
作為一款原生分布式數據庫,OceanBase原本就具有的企業級分布式數據庫能力,為AI時代的海量數據處理分析打下了基礎。對于支持AI應用落地的核心基礎設施比如向量性能、混合檢索等層面,OceanBase也在持續探索,進一步加強SQL+AI能力。比如,模型上下文協議(MCP,Model Context Protocol)是最近一款非常流行的技術,通過MCP能把每個產品接入大模型生態里,OceanBase的OceanBase service和OceanBase的管控工具OCP目前均已實現MCP支持,未來OceanBase也會全面擁抱MCP的大模型生態。
正如楊冰所言:“面向未來要搭建的不是另外一幢十幾層的高樓大廈,而是要搭建一百層甚至好幾百層的摩天大樓,這時就需要重新構建底層基礎設施,而這也是我們所擅長的,我們也有強烈的被召喚的使命感。”未來的應用一定是基于AI的應用,未來的數據公司也都會是AI公司。”楊冰還說道:“作為一個數據存儲軟件未來要支撐的不僅僅是存和算,還要去支持知識的學習和獲取、支持應用的推理、支持更多的決策。”為了更好地推進這些方向,OceanBase定下了四個大方向:一是成為“知識底座”,二是打破“數據次元壁”, 三是當AI的“靠譜參謀”, 四是做流量的“沖浪高手”。
而作為AI戰略“一號位”的楊傳輝,針對Data×AI分享了更多細節。他表示OceanBase正致力于構建能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。
Data x AI從概念上可以分成兩層:Bring Data to AI和Bring AI to Data。Bring Data to AI,指的是要把數據融入大模型里,通過數據提升模型準確度,從而提升推理效率并降低推理成本。Bring AI to Data,則分成兩個層次:第一個層次是在數據庫里通過類似AI function的方式直接集成大模型的能力;第二個層次是把AI融合到整個數據庫,以便提升數據庫的可應用性,比如開發智能知識庫和智能助手等。
此外,在楊傳輝描繪的一體化數據底座版圖中,OceanBase希望能夠實現從算力、基礎設施,到平臺層、應用層、交付形態的全方位布局。他表示:“未來15年一定是一個AI大爆發的時代,我們也相信隨著AI的應用場景以及來自中國乃至世界的AI場景打磨,OceanBase將成為AI時代的一體化數據底座。”
那么,OceanBase的信心從何而來?對此,楊傳輝表示:首先,Data x AI一體化數據底座其實是OceanBase一體化數據庫的延伸,它的核心在于能否做好數據處理。未來,OceanBase一定會拓展數據處理范疇,但是并不會把自己局限在關系數據庫的舒適圈里,而是會讓數據處理更好地適應AI時代的工作負載。其次,AI時代的應用大爆發給了OceanBase更大的機會,AI時代的應用一方面需要更多的數據,另一方面需要混合負載。對于開發者來說,他們希望在一套引擎里直接通過一條SQL處理所有的工作負載,而一體化和分布式恰好是OceanBase的優勢。“今天我可以告訴大家,OceanBase的研發團隊既能做數據庫,也能做分布式系統,還能做AI的infra。再加上由螞蟻集團技術能業務場景支持,OceanBase做這件事情是非常順理成章的。”楊傳輝表示。他還總結稱:“學AI用AI,學OB用OB。只要大家學好AI、學好OB,我們都能很好地掌握AI時代的數據和技術。”
如前所述,OceanBase原本是螞蟻集團的一個子部門,后來獨立出來成立單獨的公司。在關系上螞蟻集團就好比是OceanBase的“長輩”,螞蟻集團CTO何征宇也在本次大會現場表示大力支持OceanBase的AI戰略。他說,螞蟻集團將支持OceanBase在金融、醫療、生活等螞蟻AI的核心場景的突破,支持OceanBase去實踐DataxAI的理念和架構創新,幫助OceanBase進一步攻堅AI關鍵能力。同時,螞蟻集團將繼續支持OceanBase開源開放,把在Data×AI上的能力逐漸開放給行業,為AGI的夢想添磚加瓦。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.