AI工業化時代,作為國產數據庫的標桿玩家,源自螞蟻集團的OceanBase站在了新的起點。
5月17日,在OceanBase第三屆開發者大會上,OceanBase對外詳細詮釋了其最新升級的“DATA x AI”戰略,并發布面向AI的應用產品PowerRAG。
作為OceanBase AI戰略落地的“一號位”,OceanBase CTO楊傳輝表示,OceanBase正致力于構建Data×AI能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。
今年4月27日,OceanBase CEO楊冰發布全員信,宣布OceanBase將全面進入AI時代,打造“DATA×AI”核心能力,建設AI時代的數據底座。
在OceanBase看來,AI時代,傳統數據庫已很難滿足全行業的需求。
一方面,AI大模型的爆發,會讓數據以及數據的處理需求,爆發式增長,比如AI大模型核心是對海量數據進行訓練與推理,且會生成海量數據。IDC報告指出,受生成式AI等技術驅動,預計2028年全球新生成數據量規模將達到393.9ZB。數據量級的指數級增長,對數據庫的架構、性能、成本等均提出新的需求。另一方面,AI時代,數據的類型更多從結構化向非結構化轉變,源自真實世界的圖像、視頻等非結構化數據更多,傳統的關系型數據庫已很難滿足。
在內部信中,楊冰表示,OceanBase面向未來思考,AI正在重塑一切,誰能更好地解決DATA和AI的融合,實現“DATA×AI”,誰就能成為AI時代的數據底座。
在打造AI時代的數據庫上,OceanBase有先天優勢。作為一家生于AI云時代的數據庫廠商,OceanBase一直將“分布式”作為自身的信仰,楊傳輝很早就提出“單機分布式一體化是數據庫的未來”的觀點。當年,傳統數據庫很難服務于螞蟻爆發式增長的數據處理需求,OceanBase應運而生,從無到有,堅持100%根自研,攻克了分布式數據庫穩定性、高并發、可擴展、實時分析和多云等難題,為市場打造了一款高質量的一體化分布式數據庫產品。
如今,隨著DeepSeek的爆發,大模型應用成本指數級下降,AI加速走向千行百業實現規模化落地。面對企業在AI時代悄然變化的需求,OceanBase已有一定的DATA x AI能力,如分布式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。
不過,在楊傳輝看來,“大模型落地產生價值的核心,在于數據與模型的一體化融合,這也是OceanBase提出的構建Data×AI能力的關鍵。”因此,OceanBase跳脫出傳統本地化數據庫的邏輯,基于一體化數據庫的現有優勢,加速向一個一體化數據底座演進,可通過一套引擎同時支持TP/AP/AI混合負載,支持向量數據庫,實現SQL與AI的混合檢索。
在發布會上,OceanBase發布了首個面向AI的應用產品PowerRAG,打通AI應用開發數據層、平臺層、接口層與應用層的全流程,可幫用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。
而在支持AI應用落地的核心基礎設施——向量性能、混合檢索等層面,OceanBase也在持續探索,進一步加強SQL+AI能力,在發布會上,OceanBase還現場“跑分”,基于基準測試工具VectorDBBench,采用Performamce768D1M測試數據集跑分測試,結果顯示,其性能超越業界三款領先的開源向量數據庫。
此外,OceanBase引入BQ量化算法(HNSW+BQ),可實現內存成本較引入前降低 95%;引入針對JSON半結構化數據的壓縮能力,在TPC-H 10G數據集上,JSON壓縮比可達 MongoDB 的3倍;支持面向多種數據模型的混合檢索能力。
OceanBase的“DATA×AI”已被多個客戶應用在真實生產場景中,比如聯通軟研院打造了服務于運營商的AI助手,in銀泰商業打造了零售業智能問數平臺。
前些年,在國產替代“信創”浪潮和企業數字化進程中,源自螞蟻,經過雙11等海量真實場景錘煉的OceanBase,基于原生分布式架構以及開源模式,成功崛起成為國產數據庫的標桿平臺。如今,在AI工業化大生產階段,作為云原生數據庫的OceanBase,不論是應對更大規模的數據處理,還是應對AI新場景下的全新AI數據處理需求,都將發揮出自身優勢,在數據產業扮演更重要的角色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.