在過去的十余年間,中國的大數據產業猶如一場技術革命,以驚人的速度蓬勃發展。十年前,金融、電信等行業構建數據倉庫時,幾乎無一例外地依賴于國際廠商的產品與服務,許多項目的成本動輒耗費千萬乃至上億元。
于是,大家對于數據建設、數據治理的印象都停留在又貴又重的階段,高昂的建設成本成為不少企業的攔路虎;但這些企業對數據建設和治理一直都有著旺盛需求。
同時,狂飆猛進的技術演進對企業數據架構的可擴展性提出了新挑戰。Gartner報告就指出,到2028年,50%構建于2023年之前的中國數據分析和AI平臺,也將因為與生態系統脫鉤而過時。
數據建設治理領域正呼喚一場革新。
日前,阿里巴巴集團副總裁、瓴羊CEO朋新宇在云棲大會瓴羊Data×AI專場論壇中指出,企業要擁抱AI時代,需要完成場景解構、業務重構。其中,數據治理領域也正在迎來一波重構浪潮。
瓴羊智能數據建設與治理產品Dataphin的誕生,直指企業在數字化轉型過程中面臨的首要挑戰:數據「臟亂差」,通過標準化數據處理流程,統一數據口徑,提供全面的數據資產管理,幫助企業建立起可靠、一致的數據基礎,為數字化轉型鋪平道路。
Dataphin最初源于阿里這個「超級工廠」的實踐經驗,逐步進化為適用于各行各業規模企業的數據治理平臺。
現在,針對行業里數據治理高成本和難擴展等建設難題,瓴羊智能數據建設與治理產品Datapin全面升級,可演進擴展的數據架構體系為企業數據治理預留發展空間,推出敏捷版用以解決企業數據量不大但需構建數據的場景問題,基于大模型打造的DataAgent更是為企業用好數據資產提供便利。
數據治理正當時,普惠低成本帶來更多選擇
瓴羊副總裁王賽在對接各類型的企業過程中,看到中小型企業有強烈的數據治理及數據資產建設的需求:企業的數據量相比龍頭企業們可能不是很大,但有復雜度和多樣性,這些企業需要把這些數據做一些輕度的治理。
但中小企業的數據治理之路面臨不少問題: 大數據相關的人才儲備可能不足,也沒有太多的預算投入,甚至對數據資產建設和數據治理的認知也有所欠缺。
基于這些痛點,瓴羊把基于阿里巴巴內部數據治理的經驗,加之服務外部企業客戶打造推出的智能數據建設與治理平臺Dataphin,進行輕量化改造,推出Dataphin敏捷版。
Dataphin敏捷版的產品架構更輕量,企業最低只需要投入三臺硬件設備,投資僅二三十萬元就能低成本啟動數據治理工作。這也意味著,相比于之前功能強大、架構復雜的Dataphin版本,廣大中小企業現在多了一個選擇。
數據治理,如何兼顧當前和長遠
當企業在開啟數據治理工作后,都會考慮一個問題,隨著業務發展,數據量變得龐大,當前系統能否滿足需求?難道又要重新評估數據架構?
比如,國內一家零售企業數據負責人,這些年遇到“成長的煩惱”,由于業務布局廣泛,企業數據需求的復雜程度和處理難度變得越來越高,他察覺到數據治理的建設思路需要發生變化:“之前更重視產生了什么數據,哪些業務流程可以數字化,以及數據合規問題。”如果往后看5年,隨著企業數據量越來越大,傳統的數倉建設思路已經不能再支撐企業的存數、管數、用數的需求。
這也是不少企業在數據治理中的共性問題——數據架構如何為未來的發展預留出空間,從而滿足未來更多更復雜的數據治理需求。基于這一行業普遍痛點,瓴羊的Datapin產品創新性升級數據系統架構:高擴展性,可持續演進升級。
如果起步期用敏捷版,發展期可以原地升級,擴展底層的算力引擎,自如地向上平滑演進,即可變身為一站式數據建設治理與運營平臺。再進一步,如果部分企業監管合規要求高,不能上云或者只能部分上云,或者有些企業本地已經搞了一攤,有些利舊的小九九。不用慌,瓴羊Dataphin支持多云多引擎,允許多云部署或者本地化私有部署,并支持50+數據源,自由混搭,滿足各種復雜場景。
“小型、中型和大型,我們都在一套部署結構之下,可以幫助企業無縫升級。”王賽說。考慮到企業數據治理的長期發展特性,企業可自如地基于自身數據規模和治理要求,選擇合適的產品。瓴羊Dataphin帶給客戶的體驗就是:不必一步到位,卻可步步到位。
半托管,兼具個性化和性價比
另外,在數據領域,企業還面臨另一大問題:個性化和和性價比之間的矛盾。大企業基于自身的業務需求,往往追求私有化部署,但這也意味著更高成本。而標準化的云產品更便宜,卻失去部分個性化配置的能力。
針對這類問題,瓴羊Dataphin的解題思路是提供靈活的部署模式:全托管、半托管、獨立部署,滿足各種部署訴求。
企業可以像租公寓一樣,直接訂閱公共云多租戶SaaS版本,按需付費;也可以采用半托管模式,快速擁有自己的獨立云別墅;更可以完全獨立部署,自己“蓋樓”,完全自主。
這其中,云上半托管模式,是當下主流客戶最愛的一種部署方式。這種模式,既能獨享可控的環境,又能享受公共云的彈性調度。相當于用戶在云上租“別墅”,1小時立等可取,獲得別墅級獨立部署產品服務。
比如,一些集團型企業,不同的業務模塊或者子業務的數據處理要求不一樣:財務類、會員類的數據要求本地運行計算;另外一些安全敏感性不高的數據可以上云,與云上業務聯動及數據處理。這類企業需求就適合半托管模式,既有個性化定制需求,又能考量經濟性需求。
總體而言,在數據建設、治理、消費領域,Dataphin正基于阿里巴巴集團多年數據治理的系統化建設經驗,為大中小不同規模的企業,提供橫跨多類引擎,適應多種環境要求的,可擴展可升級的數據治理產品。
數據治理領域,企業正迎來按需采購、自如升級的新階段。
AI時代,如何讓數據資產快速用起來
王賽發現很多數據治理平臺的項目都具有一個規律:如果對方是一個純IT團隊,沒有數據資產運營的理念,這類項目的成功率往往不會很高。
數據如果只存儲在數據庫里,只會成為成本和負擔。王賽提到:“我們刻在骨子里的理念就是數據構建好之后,一定要把數據用起來。” 所以瓴羊非常強調數據資產的治理和運營,光把數據聚合在一起還不夠,還要讓數據更好地用起來。
要讓企業用好數據,客觀存在著一個巨大的鴻溝。對業務人員而言,理解業務和理解數據是兩碼事。很多時候業務人員缺乏數據思維,數據獲取依然要求助于數據專家,這面臨著大量的溝通和時間成本。而在具體的獲取數據環節,數據團隊壓力也很大。他們經常會面臨大量的關于數據在哪里、該數據含義、如何使用、在哪里使用的咨詢。并且,要在海量的數據資產中快速找到、找對、找準想要的數據并不容易。
這反映出,企業用數需求,不止是從Chatbot中獲得一個具體的數據結果,還涉及到基于業務需求如何去找到和使用好內部的數據。
舉個例子,王賽經常碰到企業用戶提這樣的問題:企業的商機轉化率低,有什么樣的數據能解決問題?解決問題的核心在業務流程里,先回到業務中,問題涉及哪些人員和組織,涉及哪些流程,這樣才有可能給用戶有價值的指導,而不是就數據返回一個數據結果。
從這一痛點出發,瓴羊推出業內首個數據資產智能體——Dataphin·DataAgent,在大模型的加持下,企業能自定義自己專屬的Agent,業務人員能更便捷實現從問題到思路、數據、用法的全鏈路自助化操作。
“未來每個人都有一個專屬的數據助手。”王賽說,它不只是工具層面幫用戶取數,還能幫助連接業務,輸入問題后直接給到數據視角的內容。
如某一家頭部乳業品牌的數據中臺已經建設多年,形成超過20個數據域,上千指標,幾百用戶標簽和近百個應用。目前一部分業務的需求仍需要通過數據工程師人工滿足,業務人員覺得響應慢,而工程師又被需求壓得喘不過氣。現在通過Dataphin的智能DataAgent,每次都能快速找到資產進行快速研發,讓研發效率翻倍。
這個過程里,Dataphin·DataAgent三大能力也展露無遺。首先是基于全域的數據資產,可以快速便捷幫助企業構建向量數據庫,完成知識庫的搭建;其次是,基于對知識庫的理解,提供諸多輔助工具和元素化的交互能力,加速智能體的設計和編排;再次,數據智能體一鍵發布,能幫助企業更方便去消費數據。
從降低中小企業啟動數據治理的門檻,到降低企業數據系統架構升級的門檻,到降低企業兼具個性化和性價比的部署門檻,到基于DataAgent智能體降低數據消費和使用的門檻,瓴羊Dataphin正在重構企業數據治理,重構企業數據服務的價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.