99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AGI時代,數(shù)據(jù)庫廠商如何破局

0
分享至


智東西
作者 程茜
編輯 漠影

生成式AI時代究竟該如何構(gòu)建數(shù)據(jù)庫?

智東西5月20日報道,剛剛過去的周六,OceanBase 2025開發(fā)者大會上,我們找到了這家數(shù)據(jù)庫廠商的答案——一體化數(shù)據(jù)底座。

OceanBase CEO楊冰說:“一體化數(shù)據(jù)底座指的是希望通過一體化產(chǎn)品、一體化引擎,同時處理OLTP、OLAP以及AI的混合負載。”

他們想要最終解決的難題就是AI的大爆發(fā)時代,數(shù)據(jù)庫應(yīng)當(dāng)如何更好地存儲、處理數(shù)據(jù),從而更好地適應(yīng)新時代需要,謀求更長遠發(fā)展。

當(dāng)下,企業(yè)的數(shù)據(jù)存儲與處理正面臨前所未有的挑戰(zhàn)。一方面,大模型訓(xùn)練、實時推理等場景產(chǎn)生的海量異構(gòu)數(shù)據(jù),要求存儲系統(tǒng)具備極高的容量彈性與跨模態(tài)管理能力;另一方面,數(shù)據(jù)處理需兼顧事務(wù)處理的實時性、分析決策的高效性及AI任務(wù)的復(fù)雜計算需求。

然而,傳統(tǒng)數(shù)據(jù)基礎(chǔ)設(shè)施與生成式AI下的數(shù)據(jù)需求割裂,產(chǎn)業(yè)亟需能整合多模態(tài)數(shù)據(jù)處理、海量數(shù)據(jù)處理等特征,并深度融合AI能力的新型數(shù)據(jù)底座。

在此背景下,國產(chǎn)數(shù)據(jù)庫的主力玩家OceanBase,已經(jīng)在數(shù)據(jù)庫轉(zhuǎn)型之路上率先突圍:宣布全面擁抱AI,打造“Data×AI”核心能力、啟動人才和組織體系升級,并圍繞一體化數(shù)據(jù)底座為核心發(fā)布首款面向AI的應(yīng)用產(chǎn)品PowerRAG。


開發(fā)者大會同天,智東西等媒體與OceanBase CEO楊冰、CTO楊傳輝進行了深入交流,試圖探尋這家數(shù)據(jù)庫主力廠商在AI時代的核心競爭力。

一、從Data Infra向Data×AI Infra躍遷,數(shù)據(jù)在AI時代的角色將如何重塑?

數(shù)據(jù)的特征會直接影響模型的性能、泛化能力和應(yīng)用效果,但伴隨著AI的發(fā)展,數(shù)據(jù)衍生出一系列亟待突破的全新挑戰(zhàn)。螞蟻集團CTO何征宇提到了四大挑戰(zhàn)。

作為大模型訓(xùn)練基石的互聯(lián)網(wǎng)公開數(shù)據(jù)即將枯竭,未來獲取高質(zhì)量數(shù)據(jù)的成本將逐步攀升。

嚴謹?shù)男袠I(yè)數(shù)據(jù)稀缺且流動困難,存在三重特征:數(shù)字化進程滯后、數(shù)據(jù)質(zhì)量要求嚴苛、核心數(shù)字化知識沉淀不足。


多模態(tài)數(shù)據(jù)需要更強處理能力。未來越來越多的數(shù)據(jù)需要包含視覺、觸覺、本體感覺和音頻等諸多信息。

數(shù)據(jù)的質(zhì)量評估難。評估的質(zhì)量決定模型質(zhì)量,但現(xiàn)有數(shù)據(jù)與模型質(zhì)量評估方式,難以指導(dǎo)大模型訓(xùn)練擺脫“訓(xùn)模如煉丹”的窘境。

對于數(shù)據(jù)的重要性,何征宇一針見血指出:“數(shù)據(jù)的邊界決定了大模型的能力上限,所有的數(shù)據(jù)公司都將成為AI公司。”

與此同時,數(shù)據(jù)量的增長仍在突飛猛進。IDC預(yù)測到2028年,受生成式AI等技術(shù)驅(qū)動,全球新生成數(shù)據(jù)量規(guī)模將達到393.9ZB,其中企業(yè)數(shù)據(jù)規(guī)模和增速尤為凸顯,全球企業(yè)級數(shù)據(jù)的數(shù)據(jù)量較2023年整體增長在400%以上。


可以看到,數(shù)據(jù)在AI時代的角色正在被重塑。正如楊冰所說,如今數(shù)據(jù)基礎(chǔ)設(shè)施不僅要實現(xiàn)“物理變化”,如支撐海量數(shù)據(jù)存儲、可擴展性等突破存儲、計算的瓶頸,還要發(fā)生“化學(xué)變化”,如支持知識的學(xué)習(xí)、獲取,支持應(yīng)用的推理以及決策。

因此,AI正驅(qū)動數(shù)據(jù)基礎(chǔ)設(shè)施Data Infra向“數(shù)據(jù)×AI”的融合架構(gòu)Data×AI Infra躍遷。

在生成式AI應(yīng)用爆發(fā)之際,傳統(tǒng)的數(shù)據(jù)基礎(chǔ)設(shè)施的轉(zhuǎn)型顯得更為急迫。IDC軟件市場研究經(jīng)理李凌霄提到,數(shù)據(jù)基礎(chǔ)設(shè)施目前的負載割裂、云環(huán)境割裂、多模態(tài)割裂、技術(shù)債務(wù)正阻礙生成式AI落地。

傳統(tǒng)TP+AP環(huán)境會造成長數(shù)據(jù)鏈條資源消耗、負載需求,無法在生成式AI場景下?lián)碛袑崟r支撐能力以及充分的計算資源;同時企業(yè)在不同云平臺間的數(shù)據(jù)交互、加工、治理割裂;傳統(tǒng)場景下專庫專用的架構(gòu)做異構(gòu)數(shù)據(jù)間聯(lián)合查詢時,會造成性能消耗和響應(yīng)延遲;企業(yè)需要在生成式AI時代,保持、延續(xù)其此前基礎(chǔ)設(shè)施架構(gòu)的完整。

其中,2023年隨著大模型發(fā)展而爆發(fā)的向量數(shù)據(jù)庫,曾因擅長處理非結(jié)構(gòu)化數(shù)據(jù)被視為企業(yè)最大化發(fā)揮數(shù)據(jù)價值的關(guān)鍵工具,但如今其難以獨立解決復(fù)雜業(yè)務(wù)問題的弊端愈發(fā)凸顯。

諸多企業(yè)實現(xiàn)向量融合的方式是在現(xiàn)有數(shù)據(jù)基礎(chǔ)設(shè)施之上融合向量插件,很少會選擇獨立部署。楊傳輝提到,向量數(shù)據(jù)庫是一個臨時態(tài),因為用戶在查詢時往往會涉及向量、標(biāo)量等混合數(shù)據(jù),獨立的向量數(shù)據(jù)庫未來會被替代。

在大模型落地行至關(guān)鍵機遇期,數(shù)據(jù)和大模型能力如何融合,成為數(shù)據(jù)庫領(lǐng)域企業(yè)決勝AI時代的核心競爭力分水嶺。深耕數(shù)據(jù)庫領(lǐng)域的OceanBase已經(jīng)先行一步,開始探索構(gòu)建適配AI時代的數(shù)據(jù)底座新范式。

二、兩大思路加速一體化數(shù)據(jù)庫轉(zhuǎn)型,首發(fā)AI產(chǎn)品PowerRAG

擁抱AI已經(jīng)成為千行百業(yè)共識,一貫秉持穩(wěn)扎穩(wěn)打理念的OceanBase于今年4月底,宣布全面進入AI時代。

彼時,OceanBase CEO楊冰發(fā)布全員信,宣布要打造“Data×AI”核心能力,加速打造AI時代數(shù)據(jù)底座。

具體來看,OceanBase的Data×AI戰(zhàn)略的關(guān)鍵是要實現(xiàn)數(shù)據(jù)與AI的融合,而一體化數(shù)據(jù)底座就是一體化數(shù)據(jù)庫的延伸,其核心仍然是能不能做好數(shù)據(jù)處理。


其背后的考量一直是以用戶需求出發(fā)。AI時代對于數(shù)據(jù)處理的兩個顯著需求是:高質(zhì)量、海量數(shù)據(jù)以及混合負載。楊傳輝說,AI應(yīng)用出現(xiàn)使得工作負載邊界逐漸模糊,其無法嚴格區(qū)分向量、標(biāo)量數(shù)據(jù),開發(fā)者的需求也隨之變化:他們希望在一套引擎里直接通過一條SQL處理所有工作負載。

這恰恰是OceanBase的核心優(yōu)勢所在。OceanBase除了能夠支持OLTP和OLAP傳統(tǒng)數(shù)據(jù)庫工作負載,還能支持AI領(lǐng)域工作負載,如半結(jié)構(gòu)化數(shù)據(jù)JSON處理、向量數(shù)據(jù)庫、混合檢索以及RAG能力等。

從宏觀角度來看,這些技術(shù)積淀為數(shù)據(jù)與模型的一體化融合提供了基礎(chǔ),成為大模型落地產(chǎn)生價值的關(guān)鍵所在。


還是從需求出發(fā),數(shù)據(jù)和模型實現(xiàn)融合需要解決的有兩大問題:數(shù)據(jù)處理和模型本身的準(zhǔn)確性、成本、行業(yè)適配性等。在此基礎(chǔ)上,OceanBase進一步將打造“Data×AI”核心能力細化為兩方面工作:

一方面是要將數(shù)據(jù)融入模型里,希望通過提高數(shù)據(jù)質(zhì)量、結(jié)構(gòu)化程度,提升模型準(zhǔn)確度、推理效率,讓小模型也能有大效果,同時降低推理成本;

另一方面是希望將AI原生集成到數(shù)據(jù)庫中,楊傳輝闡述說這有兩種融合方式,一是較為直觀的在數(shù)據(jù)庫里通過類似AI function方式直接集成大模型能力,另一種是實現(xiàn)SQL+AI的混合計算,分析、問答一體完成,這樣的融合需要較長的時間來實現(xiàn)。

關(guān)于一體化數(shù)據(jù)底座布局的考量,OceanBase在產(chǎn)品層面首發(fā)了面向AI的應(yīng)用產(chǎn)品PowerRAG,為開發(fā)者打造AI驅(qū)動的開箱即用RAG服務(wù)。

楊傳輝說,他們首要解決的是“能用”問題,通過RAG方式提升大模型準(zhǔn)確率,再逐步從“可用”推進到“好用”,使得AI應(yīng)用走向?qū)嶋H生產(chǎn)場景。


傳統(tǒng)的搭建RAG服務(wù)方案存在開發(fā)周期長、維護成本高、灰箱調(diào)試困難、性能難以優(yōu)化等問題。打通應(yīng)用開發(fā)數(shù)據(jù)層、平臺層、接口層與應(yīng)用層全流程的PowerRAG,可以提供Document(文檔)和 Chat(對話)兩個核心API接口,使得用戶可以快速實現(xiàn)文檔知識庫、智能對話、圖像比對、數(shù)據(jù)分析等多種AI應(yīng)用場景的開發(fā)。

這只是OceanBase在應(yīng)用層面探索的第一步。未來,OceanBase將逐漸形成從算力、基礎(chǔ)設(shè)施,到平臺層、應(yīng)用層、交付形態(tài)的一體化數(shù)據(jù)底座全方位布局。

三、15年積淀,企業(yè)級分布式數(shù)據(jù)庫能力已打下基礎(chǔ)

這個勢頭正猛的國產(chǎn)數(shù)據(jù)庫主力,經(jīng)過15年的磨礪,已經(jīng)淬煉出獨特的Data×AI Infra方法論,構(gòu)建起智能時代的核心競爭力。

成立自2010年的OceanBase,是螞蟻集團100%自研的原生分布式數(shù)據(jù)庫,目前支持支付寶全部核心賬務(wù)、核心支付系統(tǒng),連續(xù)十余年穩(wěn)定支撐雙十一的高并發(fā)場景。

如今OceanBase取得的成績可以用這幾個數(shù)據(jù)加以概括:IDC發(fā)布的《2024年上半年中國分布式事務(wù)數(shù)據(jù)庫軟件市場跟蹤報告》顯示,OceanBase占據(jù)獨立數(shù)據(jù)庫市場份額第一、市場整體第四;楊冰透露,目前OceanBase社區(qū)已經(jīng)擁有超2.5萬名開發(fā)者,突破100萬下載次數(shù)、可統(tǒng)計的開源集群數(shù)超5萬個。


OceanBase已通過橫向擴展的技術(shù)底座構(gòu)建起符合AI時代技術(shù)能力的技術(shù)基礎(chǔ),同時以縱向深化的高性能數(shù)據(jù)處理基準(zhǔn),為打造AI時代的一體化數(shù)據(jù)底座積勢。

從技術(shù)底座的布局看,OceanBase最基本的企業(yè)級分布式數(shù)據(jù)庫能力,為AI時代的海量數(shù)據(jù)處理分析打下基礎(chǔ)。同時,其同步推進向量性能、混合檢索等支持AI應(yīng)用落地的核心基礎(chǔ)設(shè)施發(fā)展。

從性能表現(xiàn)看,OceanBase的性能已經(jīng)達到開源向量數(shù)據(jù)庫業(yè)界領(lǐng)先水平。楊傳輝現(xiàn)場演示對比了OceanBase與業(yè)界主流的3款開源向量數(shù)據(jù)庫,結(jié)果顯示,OceanBase的跑分超過其他三大業(yè)界主流開源向量數(shù)據(jù)庫。


此外,在處理海量數(shù)據(jù)方面,OceanBase引入BQ量化算法,OceanBase的測試結(jié)果顯示,在同等召回率與性能的情況下,引入該算法(HNSW+BQ)能夠?qū)崿F(xiàn)內(nèi)存成本較HNSW降低 95%。

為幫助用戶降低AI場景中常見的半結(jié)構(gòu)化數(shù)據(jù)存儲成本,OceanBase引入針對JSON半結(jié)構(gòu)化數(shù)據(jù)的壓縮能力。經(jīng)OceanBase測試, OceanBase在TPC-H 10G數(shù)據(jù)集上JSON壓縮比可達MongoDB的3倍。

同時,在技術(shù)布局的前瞻構(gòu)建與用戶需求的精準(zhǔn)洞察之外,OceanBase宣布了全維度擁抱AI的戰(zhàn)略決斷,并且即刻啟動組織效能革新與人才結(jié)構(gòu)升級的雙輪驅(qū)動。

OceanBase CTO楊傳輝擔(dān)任AI戰(zhàn)略一號位,全面統(tǒng)籌AI戰(zhàn)略制定和技術(shù)產(chǎn)品落地,同時成立AI平臺與應(yīng)用部、AI引擎組等,將形成AI時代從一體化存儲到一體化計算的全方位布局。

全面進入AI時代背后,是OceanBase打造AI時代一體化數(shù)據(jù)底座的技術(shù)底氣與信心。

結(jié)語:OceanBase全面擁抱AI,數(shù)據(jù)庫轉(zhuǎn)型已先行一步

隨著AI發(fā)展,數(shù)據(jù)庫在智能生態(tài)中承載的能力正經(jīng)歷顛覆性變革,從傳統(tǒng)的數(shù)據(jù)存儲容器蛻變?yōu)轵?qū)動AI全流程的智能引擎。

數(shù)據(jù)庫企業(yè)正以主動變革的姿態(tài),將技術(shù)迭代轉(zhuǎn)化為AI時代的增長引擎。OceanBase希望由“數(shù)據(jù)庫”向“數(shù)據(jù)底座”演進,形成全方位、一體化處理這些問題的解決方案,為AI時代的企業(yè)解決數(shù)據(jù)處理難題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
男女4x100米混合接力決賽:浙江隊超強陣容奪冠 潘展樂收獲第四金

男女4x100米混合接力決賽:浙江隊超強陣容奪冠 潘展樂收獲第四金

直播吧
2025-05-20 21:25:16
月入1萬2,背債1個億:揭秘職業(yè)背債人的黑產(chǎn)業(yè)鏈

月入1萬2,背債1個億:揭秘職業(yè)背債人的黑產(chǎn)業(yè)鏈

李砍柴
2025-05-20 00:02:29
陳奕迅因“感染新冠肺炎去世”?“臺山TV”發(fā)的視頻引發(fā)歌迷恐慌,工作室下的留言爆了:起來上班,趕緊辟謠

陳奕迅因“感染新冠肺炎去世”?“臺山TV”發(fā)的視頻引發(fā)歌迷恐慌,工作室下的留言爆了:起來上班,趕緊辟謠

澳門月刊
2025-05-19 09:53:22
很嚴重了,大家勒緊褲腰帶過日子吧!

很嚴重了,大家勒緊褲腰帶過日子吧!

中產(chǎn)先生
2025-05-20 12:10:17
黃楊鈿甜畢業(yè)典禮獻唱視頻曝光被指跑調(diào),網(wǎng)友質(zhì)疑藝考成績有水分,高中母校回應(yīng)

黃楊鈿甜畢業(yè)典禮獻唱視頻曝光被指跑調(diào),網(wǎng)友質(zhì)疑藝考成績有水分,高中母校回應(yīng)

上游新聞
2025-05-20 20:27:19
美媒:日韓印,準(zhǔn)備學(xué)習(xí)中國!

美媒:日韓印,準(zhǔn)備學(xué)習(xí)中國!

環(huán)球時報國際
2025-05-20 00:00:17
烏克蘭總統(tǒng):愿進行任何形式的談判但領(lǐng)土妥協(xié)、撤軍“免談”

烏克蘭總統(tǒng):愿進行任何形式的談判但領(lǐng)土妥協(xié)、撤軍“免談”

新華社
2025-05-20 06:04:02
突發(fā)!歌手喬鵬菲去世,年僅46歲,是金鐵霖的學(xué)生,多次登上央視

突發(fā)!歌手喬鵬菲去世,年僅46歲,是金鐵霖的學(xué)生,多次登上央視

180°視角
2025-05-20 17:31:15
娛樂圈”新品種”黃軒:只戀愛不結(jié)婚一生只愛一人,顛覆大眾認知

娛樂圈”新品種”黃軒:只戀愛不結(jié)婚一生只愛一人,顛覆大眾認知

娛樂白名單
2025-05-19 23:47:13
美國公布新型核彈B61-13,威力是廣島原子彈的21倍

美國公布新型核彈B61-13,威力是廣島原子彈的21倍

澎湃新聞
2025-05-20 20:38:28
來了,曼城!5000萬歐“白菜價”敲定頂級中場!巴西飛翼同意加盟

來了,曼城!5000萬歐“白菜價”敲定頂級中場!巴西飛翼同意加盟

頭狼追球
2025-05-20 17:52:57
華盛頓牙齒掉光后,從奴隸口中拔了9顆牙齒,裝到自己的嘴巴里

華盛頓牙齒掉光后,從奴隸口中拔了9顆牙齒,裝到自己的嘴巴里

瑤卿文史
2025-05-20 16:43:20
讀懂IPO|人用TAT撐起九成營收,江西生物欲擺脫單品依賴,引入3款在研獸藥

讀懂IPO|人用TAT撐起九成營收,江西生物欲擺脫單品依賴,引入3款在研獸藥

時代投研
2025-05-20 18:23:37
一石激起千層浪!63歲張學(xué)友被聯(lián)名舉報,徹底不再被世界寬容

一石激起千層浪!63歲張學(xué)友被聯(lián)名舉報,徹底不再被世界寬容

火之文
2025-05-20 17:49:51
俄羅斯首次扣押油輪后,愛沙尼亞叫囂要開戰(zhàn),并稱可動員44萬兵力

俄羅斯首次扣押油輪后,愛沙尼亞叫囂要開戰(zhàn),并稱可動員44萬兵力

碳基生物關(guān)懷組織
2025-05-20 18:14:50
臺島空域激烈對峙!美軍機沖向汕頭外海,遭中方強硬攔截驅(qū)離!

臺島空域激烈對峙!美軍機沖向汕頭外海,遭中方強硬攔截驅(qū)離!

說天說地說實事
2025-05-20 21:23:04
驚天大爆冷!林高遠2-4慘敗,無緣決戰(zhàn)王楚欽,卻把壓力給大頭了

驚天大爆冷!林高遠2-4慘敗,無緣決戰(zhàn)王楚欽,卻把壓力給大頭了

嘴炮體壇
2025-05-20 23:44:35
網(wǎng)傳天才圍棋少年跳樓身亡:長期遭父親當(dāng)眾毆打,獲冠軍還不滿意

網(wǎng)傳天才圍棋少年跳樓身亡:長期遭父親當(dāng)眾毆打,獲冠軍還不滿意

社會醬
2025-05-20 17:18:44
手越伸越長,吃相未免有點太難看了

手越伸越長,吃相未免有點太難看了

末名先生
2025-05-20 17:09:48
李鵬總理的6位家人:3位子女都是國家棟梁,如今都官至何位?

李鵬總理的6位家人:3位子女都是國家棟梁,如今都官至何位?

轉(zhuǎn)身微笑梅
2025-05-20 20:47:45
2025-05-21 01:40:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
9879文章數(shù) 116756關(guān)注度
往期回顧 全部

科技要聞

蘋果公布WWDC25邀請函:6月10日舉行

頭條要聞

外媒稱中國防長將不會出席香格里拉對話會 外交部回應(yīng)

頭條要聞

外媒稱中國防長將不會出席香格里拉對話會 外交部回應(yīng)

體育要聞

廣廈總冠軍!CBA歷史第8支總冠軍球隊!

娛樂要聞

包文婧二胎生啦 曬出四人全家福

財經(jīng)要聞

一年定期破1 跨城存款"特種兵"淡出江湖

汽車要聞

幾千塊提不走!最便宜的汽車奔騰小馬真相在這里

態(tài)度原創(chuàng)

教育
游戲
健康
數(shù)碼
手機

教育要聞

又是一道高次冪求解,相信你也遇到過這種題型

比GTA6還要更火爆的,是不穿衣服的主角

唇皰疹和口腔潰瘍是"同伙"嗎?

數(shù)碼要聞

蘋果公布WWDC25邀請函:6月10日舉行 iOS19等系統(tǒng)獲更新

手機要聞

蘋果公布 WWDC25 時間表,開幕主題演講將于 6 月 10 日舉行

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 长武县| 武隆县| 曲靖市| 应城市| 永吉县| 太康县| 丰镇市| 济阳县| 韶关市| 北碚区| 浪卡子县| 朔州市| 丽水市| 汶上县| 云浮市| 蓬安县| 炉霍县| 綦江县| 连平县| 陆川县| 梁山县| 呼玛县| 慈溪市| 北安市| 固安县| 高台县| 固原市| 昌吉市| 越西县| 余姚市| 卢湾区| 甘德县| 上思县| 永年县| 开远市| 巴东县| 磐石市| 连州市| 张家口市| 隆德县| 龙口市|