視點(diǎn) 發(fā)自 凹非寺
量子位|公眾號(hào) QbitAI
Agent 產(chǎn)品正發(fā)布得火熱,但要說(shuō)到真正懂企業(yè)、懂決策的 Agent 還不算常有。
其背后,還有大量企業(yè)積累的業(yè)務(wù)數(shù)據(jù),在等待被高效利用起來(lái)。數(shù)據(jù) Agent 會(huì)成為一個(gè)好解法嗎?
為此,我們邀請(qǐng)到了 Agent 公司的代表數(shù)勢(shì)科技聯(lián)合創(chuàng)始人譚李,以及數(shù)據(jù)庫(kù)公司的代表飛輪科技科技聯(lián)合創(chuàng)始人肖康,聊了聊什么是“懂業(yè)務(wù)”的 Agent、Agent 與傳統(tǒng) BI 的關(guān)系、Agent 如何參與決策,以及在未來(lái)企業(yè)中的角色等等。
對(duì)話(huà)亮點(diǎn)
- 即使是一個(gè)通用指標(biāo)——商品毛利,每家企業(yè)的計(jì)算方法也不同。一個(gè)懂業(yè)務(wù)的 Agent,首先要明確“商品毛利”背后到底是兩項(xiàng)、五項(xiàng)還是十五項(xiàng)指標(biāo)的組合。
- 數(shù)據(jù)分析正在從 “User-facing” 正在轉(zhuǎn)向 “Agent-facing”。
- Data Agent 帶來(lái)的變革本質(zhì)上提升了人與數(shù)據(jù)系統(tǒng)的交互頻率與效率。
- Data Agent 適合應(yīng)用的場(chǎng)景很多,但它們背后都具備一個(gè)共同的關(guān)鍵特征——靈活、及時(shí)的決策。
以下基于嘉賓分享梳理,在不改變?cè)饣A(chǔ)上有一定刪改。
“懂業(yè)務(wù)”的Agent,不只是工具,更是數(shù)據(jù)秘書(shū)
量子位:我們可以先從“懂業(yè)務(wù)”這個(gè)概念聊起。能否請(qǐng)數(shù)勢(shì)科技介紹一下,你們是如何理解“懂業(yè)務(wù)”的 Agent?是否可以用幾個(gè)關(guān)鍵詞或能力指標(biāo)來(lái)定義?
數(shù)勢(shì)科技譚李:懂業(yè)務(wù)的 Agent,我們可以用一個(gè)形象的比喻來(lái)理解:它就像是跟了你多年的秘書(shū),非常了解你。你剛開(kāi)始表達(dá)需求,它就能推斷出你的目標(biāo),并進(jìn)行分析和執(zhí)行。這是我們所說(shuō)的“懂業(yè)務(wù)”。而不懂業(yè)務(wù)的 Agent 更像是一個(gè)剛剛到崗的外包人員,雖然具備通用能力,但對(duì)我們的業(yè)務(wù)語(yǔ)境、知識(shí)缺乏基本理解。
我們可以把“懂”拆解為三個(gè)層次:第一是“我知道是什么”(What),即對(duì)業(yè)務(wù)概念的理解;第二是“我知道為什么”(Why),能理解背后的邏輯;第三是“我知道怎么辦”(How),能提出實(shí)際操作建議。一個(gè)懂業(yè)務(wù)的 Agent,應(yīng)該能在這三方面與使用者形成良好互動(dòng)。
以我們服務(wù)的一些大型零售客戶(hù)為例,例如沃爾瑪、山姆、永輝、胖東來(lái)等企業(yè)。我們發(fā)現(xiàn),即使是一個(gè)通用指標(biāo)——商品毛利,每家企業(yè)的計(jì)算方法也不同。例如,有的企業(yè)會(huì)考慮試吃損耗、聯(lián)合促銷(xiāo)返利、破損過(guò)期、盤(pán)盈盤(pán)虧等因素,而有的則不會(huì)。這些細(xì)節(jié)體現(xiàn)了 What 層的差異。一個(gè)懂業(yè)務(wù)的 Agent,首先要明確“商品毛利”背后到底是兩項(xiàng)、五項(xiàng)還是十五項(xiàng)指標(biāo)的組合。
接下來(lái)是 Why 的層面。如果你讓一個(gè)通用 Agent 分析商品毛利,它可能會(huì)告訴你哪個(gè)品類(lèi)毛利高,哪個(gè)低,卻無(wú)法解釋為什么。例如,洗發(fā)水的毛利偏低,日用百貨/服飾類(lèi)的產(chǎn)品毛利非常高;洗發(fā)水毛利與寶潔這樣的頭部品牌控制著定價(jià)權(quán)有一定的相關(guān)性。只有懂業(yè)務(wù)的 Agent 才知道品類(lèi)與毛利之間的業(yè)務(wù)邏輯關(guān)聯(lián)。
第三層是 How。當(dāng)你問(wèn)如何提高一籃子貨的毛利水平時(shí),通用 Agent 可能會(huì)說(shuō)“你漲價(jià)”或“你降本”,這雖然沒(méi)錯(cuò),但太粗淺。懂業(yè)務(wù)的 Agent 會(huì)說(shuō):“你需要重新評(píng)估這一籃子貨的商品結(jié)構(gòu),因?yàn)槟愕纳唐方Y(jié)構(gòu)決定整體毛利水平。”總結(jié)來(lái)說(shuō),懂業(yè)務(wù)的 Agent 不僅要回答 What,更要理解 Why,最終提出貼近業(yè)務(wù)實(shí)際的 How。
量子位:現(xiàn)在很多通用型 Agent,也會(huì)稱(chēng)自己的產(chǎn)品為秘書(shū)、工作伙伴。那數(shù)勢(shì)科技認(rèn)為,企業(yè)級(jí)數(shù)據(jù) Agent 的定位和價(jià)值具體在哪里?
數(shù)勢(shì)科技譚李:我們可以從兩個(gè)維度劃分 Agent:通用 vs 垂直、企業(yè)級(jí) vs 非企業(yè)級(jí)。我們產(chǎn)品落在“垂直 + 企業(yè)級(jí)”的象限,專(zhuān)注于數(shù)據(jù)領(lǐng)域。
我們?cè)趺凑J(rèn)知產(chǎn)品呢?首先,它的使用對(duì)象是企業(yè)內(nèi)部的業(yè)務(wù)人員和分析師,因此“懂業(yè)務(wù)”尤為重要。我們并不是簡(jiǎn)單調(diào)用大模型,而是構(gòu)建企業(yè)私域知識(shí),使每個(gè)企業(yè)可以配置或?qū)胱约旱闹R(shí)體系,并讓產(chǎn)品進(jìn)行學(xué)習(xí)和迭代。
然后它的使用場(chǎng)景,是在企業(yè)做業(yè)務(wù)決策時(shí),提供分析的支持。那么企業(yè)能夠在私域的語(yǔ)義環(huán)境下,讓業(yè)務(wù)人員或分析師以更高效的方式拿到數(shù)據(jù)與洞見(jiàn),來(lái)支持業(yè)務(wù)決策。
量子位:那從數(shù)據(jù)庫(kù)的角度來(lái)看,飛輪科技認(rèn)為一個(gè)“懂業(yè)務(wù)”的 Agent 在數(shù)據(jù)處理上應(yīng)該具備哪些能力?數(shù)據(jù)庫(kù)發(fā)揮了怎樣的作用?
飛輪科技肖康:我們理解的“懂業(yè)務(wù)” Agent,與通用型最大的區(qū)別在于它理解的是“有語(yǔ)義的數(shù)據(jù)”,而非裸數(shù)據(jù)(Raw data)。現(xiàn)在很多人嘗試用大模型進(jìn)行 Text-to-SQL 查詢(xún),比如詢(xún)問(wèn)“企業(yè)銷(xiāo)售預(yù)測(cè)”,雖然能生成 SQL 語(yǔ)句并運(yùn)行,但效果并不好:一方面數(shù)據(jù)不準(zhǔn)確,另一方面還需要人工校驗(yàn),反而增加了成本,甚至可能誤導(dǎo)決策。
我們分析下來(lái),一個(gè)重要的問(wèn)題是在于中間缺少了“語(yǔ)義層”。理想的方式是讓自然語(yǔ)言首先映射到已經(jīng)建模、貼合業(yè)務(wù)語(yǔ)義的指標(biāo)數(shù)據(jù)中,比如指標(biāo)平臺(tái)中的數(shù)據(jù)。以商品毛利為例,不同企業(yè)的定義不同,如果跳過(guò)語(yǔ)義層直接查數(shù)據(jù)庫(kù),很容易出錯(cuò)。因此我們認(rèn)為,有語(yǔ)義的指標(biāo)平臺(tái)是關(guān)鍵,它是讓 Agent 真正“懂業(yè)務(wù)”的基礎(chǔ)。
量子位:現(xiàn)在企業(yè)級(jí) Agent 是如何模擬人類(lèi)分析師的,在提問(wèn)和歸因邏輯上有沒(méi)有特別的處理方法?
數(shù)勢(shì)科技譚李:我們前面把 Data Agent 比作“跟了你多年的數(shù)據(jù)秘書(shū)”,我可以再舉個(gè)例子:它就像企業(yè)為每個(gè)業(yè)務(wù)人員配備了一頭“電子牛馬”。以前,數(shù)據(jù)分析主要依賴(lài)“表哥表姐”手動(dòng)處理分析任務(wù),可能2個(gè)分析師要支持4、5個(gè)業(yè)務(wù)部門(mén);而且還需要足夠了解業(yè)務(wù)團(tuán)隊(duì)。
而現(xiàn)在,則由分析師“飼養(yǎng)”一群數(shù)據(jù) Agent,讓它們替代自己完成重復(fù)勞動(dòng),打破了人力的瓶頸。通過(guò) Data Agent 實(shí)現(xiàn)了“人人用數(shù)”,可以說(shuō)是帶來(lái)了數(shù)據(jù)生產(chǎn)和數(shù)據(jù)消費(fèi)上的根本性變革。
正如肖總提到的早期很多企業(yè)用 Text-to-SQL 的方式準(zhǔn)確率很低。其實(shí)我們從 2023 年就開(kāi)始提倡路徑是 NLP-to-Semantic,即通過(guò)自然語(yǔ)言映射到語(yǔ)義層,再由語(yǔ)義層去連接底層復(fù)雜的數(shù)據(jù)邏輯。這些語(yǔ)義層建立在企業(yè)內(nèi)部分析師的指標(biāo)體系與業(yè)務(wù)邏輯之上,更貼合企業(yè)實(shí)際。
量子位:那在飛輪科技打造懂業(yè)務(wù)的 Agent 時(shí),底層數(shù)據(jù)庫(kù)做了哪些工作?比如為了實(shí)現(xiàn)跨表處理等功能,數(shù)據(jù)庫(kù)有什么需要特別做到的嗎?
飛輪科技肖康:AI 時(shí)代到底需要什么樣的數(shù)據(jù)庫(kù),大家都在問(wèn)。我們的看法是,對(duì)像我們這種分析型數(shù)據(jù)庫(kù)來(lái)說(shuō),需求只會(huì)越來(lái)越高。比如 BI 查詢(xún),過(guò)去是數(shù)據(jù)工程師寫(xiě)程序、拉報(bào)表,現(xiàn)在用戶(hù)可以直接用自然語(yǔ)言跟系統(tǒng)對(duì)話(huà)。這背后,其實(shí)就是 Agent 在替用戶(hù)發(fā)起查詢(xún)。未來(lái),Agent 甚至?xí)嫒俗龃蟛糠譀Q策和分析。
你可以理解成,分析從 “User-facing” 正在轉(zhuǎn)向 “Agent-facing”。雖然現(xiàn)在 Agent 還沒(méi)那么多,但未來(lái)它們的數(shù)量可能是人的十倍、百倍。而且它們不會(huì)“休息”——不是像人一天看兩次報(bào)表,而是每幾分鐘就查詢(xún)一次。這對(duì)數(shù)據(jù)庫(kù)提出三個(gè)挑戰(zhàn):
第一,高并發(fā)和高頻訪(fǎng)問(wèn)。Agent 是程序,要求響應(yīng)快、并發(fā)高,幾千甚至上萬(wàn)并發(fā)去做查詢(xún)是常態(tài)。
在這個(gè)方面,過(guò)去數(shù)據(jù)的分析是面向內(nèi)部、專(zhuān)業(yè)人士的用數(shù),現(xiàn)在也會(huì)有面對(duì)外部用數(shù)的需求(編者注:可以將 Agent 用數(shù)理解為一種外部用數(shù))。我們團(tuán)隊(duì)早期在百度做 Doris 項(xiàng)目的時(shí)候,就意識(shí)到像 Hadoop 、MySQL 是滿(mǎn)足不了這些需求的。
第二,更強(qiáng)的實(shí)時(shí)性。過(guò)去數(shù)據(jù)延遲可以是小時(shí)、分鐘,現(xiàn)在要做到上一秒用戶(hù)產(chǎn)生了數(shù)據(jù),下一秒就能分析。像傳統(tǒng)的數(shù)倉(cāng)使用的是批量的技術(shù),就是不能滿(mǎn)足這樣的實(shí)時(shí)需求的。
第三,數(shù)據(jù)類(lèi)型更多樣。不僅是結(jié)構(gòu)化數(shù)據(jù),像現(xiàn)在企業(yè)內(nèi)部的文檔、用戶(hù)評(píng)論都要用來(lái)做分析,非結(jié)構(gòu)數(shù)據(jù)如文本、文檔、評(píng)論,甚至圖片、音視頻,這些都要能參與分析。
在這么多年的發(fā)展過(guò)程中,我們也積累了很多的技術(shù)來(lái)去解決這些需求,比如我們做了各種索引優(yōu)化,不斷榨干 CPU 資源來(lái)提升效率。還專(zhuān)門(mén)做了面向半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的架構(gòu)設(shè)計(jì),和對(duì)象存儲(chǔ)等系統(tǒng)(像 COS)打通,支撐 AI 任務(wù)里的多源數(shù)據(jù)分析。
可以說(shuō),我們的數(shù)據(jù)庫(kù)就是為 AI 時(shí)代的 Agent 服務(wù)的,從架構(gòu)到底層能力,都在往這個(gè)方向演進(jìn)。
個(gè)性化、主動(dòng)式Agent正在取代傳統(tǒng)BI
量子位兩位老師也都提到了,傳統(tǒng)企業(yè)是使用報(bào)表或傳統(tǒng)BI來(lái)進(jìn)行數(shù)據(jù)分析的。那么從產(chǎn)品能力看,Agent+Data與傳統(tǒng)BI+大模型的最大差異在哪里?
數(shù)勢(shì)科技譚李:這其實(shí)正是我們剛才提到的技術(shù)路徑差異。可以簡(jiǎn)單將其概括為兩種路徑:一種是 Data Agent 的路徑,另一種是 Chat 與 BI 的路徑。兩者的核心差異可以總結(jié)為三點(diǎn)。
第一是「Personal」——Data Agent 更具個(gè)性化。在 BI 報(bào)表基礎(chǔ)上疊加大模型,用戶(hù)可以通過(guò) Chat 的方式來(lái)查詢(xún)數(shù)據(jù),確實(shí)解決了靈活性問(wèn)題,但你會(huì)發(fā)現(xiàn),它仍然是基于報(bào)表內(nèi)容本身,并不是為某個(gè)具體用戶(hù)量身定制的。
而智能代理 Agent 就像是你的個(gè)人數(shù)據(jù)秘書(shū),它能夠理解你的分析習(xí)慣。當(dāng)對(duì)兩位員工同時(shí)提到「幫我看一下過(guò)去一個(gè)月的業(yè)績(jī)情況,KPI 達(dá)標(biāo)了嗎」這個(gè)問(wèn)題時(shí),他們看到的內(nèi)容可能不一樣,因?yàn)樗麄兯诓块T(mén)不同、KPI 不同、目標(biāo)值也不同。這種情況是傳統(tǒng) BI 難以解決的,而 Data Agent 能夠理解你個(gè)性化的語(yǔ)境與背景,提供真正專(zhuān)屬的分析支持。
第二個(gè)特性是「Proactive」——主動(dòng)性。傳統(tǒng)的 Chat BI 是典型的“我問(wèn)你答”,而且有時(shí)答不出來(lái),或者數(shù)據(jù)還不完整,這種方式本質(zhì)上是被動(dòng)的,用戶(hù)還需要有明確問(wèn)題意識(shí),門(mén)檻很高。而Data Agent 則是主動(dòng)式的,它能根據(jù)設(shè)定推送數(shù)據(jù)、發(fā)出預(yù)警,自動(dòng)生成報(bào)告。比如在老板早上進(jìn)辦公室前,它就應(yīng)當(dāng)已將關(guān)鍵數(shù)據(jù)整理好放在他桌面上,而不是等老板進(jìn)來(lái)后才被動(dòng)去處理。Data Agent 就是一個(gè)主動(dòng)匯報(bào)、主動(dòng)發(fā)現(xiàn)問(wèn)題的智能秘書(shū),范式完全不同。
第三點(diǎn)是「Powerful」——更強(qiáng)大。Agent 不只是信息查詢(xún)的工具,它還能主動(dòng)執(zhí)行一系列操作。比如我們有一個(gè)客戶(hù)是大型零售連鎖,全國(guó)有幾千家門(mén)店,他們通過(guò) Agent 分析門(mén)店經(jīng)營(yíng)數(shù)據(jù)后,可以自動(dòng)判斷出哪些門(mén)店存在特定問(wèn)題,并觸發(fā)任務(wù)系統(tǒng),直接將具體改進(jìn)任務(wù)下發(fā)給店長(zhǎng)或店員,這些任務(wù)根據(jù)公司 SOP 要求在一周內(nèi)完成。這種決策-執(zhí)行聯(lián)動(dòng)的能力,是傳統(tǒng) BI 無(wú)法實(shí)現(xiàn)的。因此,Data Agent 相較 Chat BI 至少更個(gè)性化、更主動(dòng)、更強(qiáng)大。
量子位:現(xiàn)在我們也觀(guān)察到一個(gè)現(xiàn)象,很多企業(yè)認(rèn)為傳統(tǒng) BI 工具并沒(méi)有充分激活沉淀下來(lái)的數(shù)據(jù)資源,也就是“沉睡的數(shù)據(jù)金礦”。那 Agent 是怎么讓這些數(shù)據(jù)真正“活”起來(lái)的?
數(shù)勢(shì)科技譚李:這是個(gè)更偏應(yīng)用側(cè)的問(wèn)題。正如前面提到的,Agent 有著主動(dòng)性、個(gè)性化等特征,而傳統(tǒng) BI 模式中,數(shù)據(jù)的使用是被動(dòng)的。業(yè)務(wù)人員需要先提出具體的問(wèn)題或需求,分析師才會(huì)從數(shù)據(jù)沼澤中挖掘數(shù)據(jù)來(lái)滿(mǎn)足這些需求。但這意味著分析師和業(yè)務(wù)人員都必須非常清晰地知道他們要什么,才能推動(dòng)整個(gè)過(guò)程。
在 Data Agent 模式下,我們通過(guò)后臺(tái) 7×24 小時(shí)持續(xù)運(yùn)行,配置各種分析范式和模板,然后由系統(tǒng)根據(jù)業(yè)務(wù)角色的差異主動(dòng)推送分析報(bào)告和預(yù)警。它不斷掃描數(shù)據(jù)、提煉洞察,并以適當(dāng)形式交付給業(yè)務(wù)人員。相當(dāng)于增加了一種數(shù)據(jù)消費(fèi)的場(chǎng)景,讓原來(lái)被忽略的數(shù)據(jù)能被挑出來(lái)、活過(guò)來(lái),背后的業(yè)務(wù)問(wèn)題和邏輯被闡釋出來(lái)。
這樣原本被忽略的“沉睡數(shù)據(jù)”就被激活了。
我還想強(qiáng)調(diào)一個(gè)未來(lái)趨勢(shì):企業(yè)員工會(huì)成為“超級(jí)個(gè)體”,擁有多個(gè) AI 工具的支持。比如除了數(shù)據(jù) Agent,還有寫(xiě) PPT 的 Agent、作圖的 Agent 等。我們認(rèn)為,一旦每個(gè)人都有一個(gè)數(shù)據(jù)秘書(shū),數(shù)據(jù)消費(fèi)將被普惠化。
過(guò)去的數(shù)據(jù)沉睡,不是因?yàn)闆](méi)有人需要,而是因?yàn)樾枨蟊患泄苤圃诜治鰩熀?BI 報(bào)表的通道里。而現(xiàn)在通道打開(kāi)后,海量業(yè)務(wù)人員的需求可以直接觸達(dá)數(shù)據(jù),通過(guò) Agent 進(jìn)行消費(fèi)。這是一種更加普惠、靈活、廣泛的數(shù)據(jù)使用方式。
量子位:那么,數(shù)據(jù)庫(kù)這邊在這方面有哪些實(shí)踐或支持方式?
飛輪科技肖康:這個(gè)點(diǎn)上,數(shù)據(jù)庫(kù)可能本身做的并不多,更多是作為支撐平臺(tái)。但我也談一下我的看法。
過(guò)去通過(guò)傳統(tǒng) BI 或表格的方式來(lái)獲取數(shù)據(jù),很多業(yè)務(wù)需求其實(shí)是被壓抑的,本質(zhì)上是由效率決定的。比如一個(gè)業(yè)務(wù)人員可能都不知道數(shù)據(jù)庫(kù)里有什么數(shù)據(jù),只有數(shù)據(jù)工程師或分析師知道。而分析師的時(shí)間和精力有限,所以業(yè)務(wù)人員不會(huì)頻繁提問(wèn)。
如果能配備一個(gè) Data Agent,業(yè)務(wù)人員就可以隨時(shí)提出需求,讓 Agent 去自動(dòng)探索數(shù)據(jù)庫(kù)中可用的數(shù)據(jù),再結(jié)合大模型和企業(yè)內(nèi)部知識(shí),完成任務(wù)。更重要的是,它還能展示分析過(guò)程,讓你理解這個(gè)答案是如何得出的,便于驗(yàn)證邏輯。這種多輪迭代機(jī)制極大提升了效率。
本質(zhì)上,這種變革提升了人與數(shù)據(jù)系統(tǒng)的交互頻率與效率。以往中間有分析師“把關(guān)”,現(xiàn)在則是直接與系統(tǒng)對(duì)話(huà)。這也對(duì)數(shù)據(jù)庫(kù)提出了新的挑戰(zhàn),比如系統(tǒng)需要支持更高的查詢(xún)頻率和更大的查詢(xún)量。以前只有“表哥表姐”使用,現(xiàn)在是全公司的人都在用。而這些查詢(xún)往往還集中在高峰期,比如上班時(shí)間。
所以數(shù)據(jù)庫(kù)需要具備彈性伸縮的能力,峰值時(shí)能擴(kuò)展更多計(jì)算資源,低谷時(shí)則能節(jié)省資源,避免企業(yè)為不必要的峰值付費(fèi)。像我們 SelectDB 就在云端提供彈性服務(wù),以支持 AI 應(yīng)用的高并發(fā)需求。
量子位:在業(yè)務(wù)場(chǎng)景中,有哪些場(chǎng)景最能體現(xiàn)數(shù)據(jù) Agent 的價(jià)值?這些場(chǎng)景有沒(méi)有一些共通的特征?
數(shù)勢(shì)科技譚李:隨著我們服務(wù)的客戶(hù)越來(lái)越多,接觸到的業(yè)務(wù)場(chǎng)景也不斷豐富,我們發(fā)現(xiàn)其實(shí)360行中,大家在原有數(shù)據(jù)消費(fèi)范式中都有很多痛點(diǎn)和問(wèn)題。可應(yīng)用的場(chǎng)景很多,但它們背后都具備一個(gè)共同的關(guān)鍵特征——靈活、及時(shí)的決策。
大型企業(yè)早已有各種指標(biāo)和 BI 報(bào)表來(lái)支撐日常分析,這部分的能力基本成熟了,區(qū)別只是分析師能力的強(qiáng)弱。但使用 Data Agent 帶來(lái)的最大不同,在于它不是依賴(lài)固定、靜態(tài)的報(bào)表,而是在動(dòng)態(tài)業(yè)務(wù)場(chǎng)景中提供實(shí)時(shí)支持決策的能力。
比如今天你需要做一個(gè)業(yè)務(wù)決策,不想拍腦袋、不靠直覺(jué),而是希望有數(shù)據(jù)支持。這個(gè)時(shí)候,如果能通過(guò)自然語(yǔ)言即時(shí)向系統(tǒng)提問(wèn)并獲得答案,那這個(gè)場(chǎng)景就極具價(jià)值。
我舉一個(gè)身邊的例子。比如在零售行業(yè),有一個(gè)典型角色叫“督導(dǎo)”,特別是大型加盟連鎖企業(yè)中。督導(dǎo)每天要巡店,拜訪(fǎng)多家直營(yíng)或加盟門(mén)店,一人通常負(fù)責(zé)幾十家。對(duì)任何人來(lái)說(shuō),記住這么多門(mén)店的信息幾乎不可能。而且督導(dǎo)雖然執(zhí)行力強(qiáng),但并不一定擅長(zhǎng)文字處理或數(shù)據(jù)分析。
他們經(jīng)常面對(duì)的場(chǎng)景是:今天要拜訪(fǎng)五家門(mén)店,卻常常在前往門(mén)店的路上才有時(shí)間臨時(shí)了解店鋪的經(jīng)營(yíng)情況,比如上個(gè)月的業(yè)績(jī)、SOP 是否預(yù)警、上次提出了哪些改進(jìn)建議、這次要重點(diǎn)檢查哪些方面。兩個(gè)門(mén)店之間的通勤時(shí)間可能也就半小時(shí),這種臨時(shí)了解非常困難。
所以,我們?yōu)槊總€(gè)督導(dǎo)配備了 Data Agent。督導(dǎo)可以對(duì)即將拜訪(fǎng)的門(mén)店隨時(shí)提問(wèn),如“這家店上月銷(xiāo)售是否異常”“員工離職率有沒(méi)有異常”等,Agent 會(huì)即時(shí)反饋,不再需要前一天做資料準(zhǔn)備或打印報(bào)表。
這個(gè)云端小助手也叫“百事通”,讓督導(dǎo)從走馬觀(guān)花式巡店,變成真正數(shù)據(jù)驅(qū)動(dòng)、精益化的單店運(yùn)營(yíng)模式。對(duì)他們來(lái)說(shuō),這是極大的效率提升,也是讓精益化單店運(yùn)營(yíng)真正落地的一個(gè)關(guān)鍵杠桿。我認(rèn)為這是一個(gè)非常具有代表性的“靈活、及時(shí)決策”的典型場(chǎng)景。
量子位:數(shù)據(jù)在什么樣的場(chǎng)景中特別能夠體現(xiàn)其價(jià)值?這些場(chǎng)景是否也有共通特征?
飛輪科技肖康:從我們與客戶(hù)的實(shí)際交流來(lái)看,數(shù)據(jù)在“垂直類(lèi)場(chǎng)景”中更容易展現(xiàn)價(jià)值,尤其是企業(yè)對(duì)自己的業(yè)務(wù)理解非常深,能夠用 AI 來(lái)重構(gòu)現(xiàn)有業(yè)務(wù)流程的公司。
比如有些企業(yè)專(zhuān)注于營(yíng)銷(xiāo)、反欺詐、或客服領(lǐng)域。他們本身就有成熟的業(yè)務(wù)模型,再通過(guò) AI + Agent 的方式進(jìn)行重構(gòu),能看到非常明顯的提升。相比之下,那些嘗試做通用型 Agent 的探索往往效果就不如預(yù)期。
而且在做垂直領(lǐng)域的應(yīng)用時(shí),還可以用傳統(tǒng)的高人力成本的方法來(lái)對(duì)比驗(yàn)證,評(píng)估 AI 方法是否有效。
所以我們看到,最有效的應(yīng)用往往是那些在本領(lǐng)域已有深厚經(jīng)驗(yàn)的公司,再用 AI 工具強(qiáng)化業(yè)務(wù),并且能被清晰評(píng)估的場(chǎng)景。這類(lèi)垂類(lèi) Agent 的推廣和落地更有效,也更容易驗(yàn)證成效。
在私域數(shù)據(jù)加持下,員工正被AI Agent增強(qiáng)
量子位:企業(yè)如何判斷一個(gè)Agent的數(shù)據(jù)決策是“合理的”或“成功的”?有沒(méi)有明確的評(píng)估標(biāo)準(zhǔn)?
數(shù)勢(shì)科技譚李:我們一直強(qiáng)調(diào)數(shù)據(jù)是用來(lái)支撐決策的。其實(shí)可以將決策場(chǎng)景分為兩類(lèi):一類(lèi)是封閉場(chǎng)景,決策規(guī)則非常清晰。比如積分規(guī)則:刷滿(mǎn)五筆,第五筆給予雙倍積分。這種場(chǎng)景的規(guī)則明確,Data Agent 可以很好地支持決策,這種規(guī)則導(dǎo)向型的場(chǎng)景,衡量標(biāo)準(zhǔn)也很清晰。
另一類(lèi)是“開(kāi)放場(chǎng)景”,決策涉及的因素非常多,特別是偏宏觀(guān)的業(yè)務(wù)決策,需要考慮的內(nèi)外部要素也更多。此時(shí),我們的理念是,Agent 不是替你做決策,而是提供決策支持和輔助。我們努力將更多的數(shù)據(jù)呈現(xiàn)出來(lái),幫助業(yè)務(wù)人員在更充足的信息背景下做出更科學(xué)的決策。
在很多企業(yè)里,業(yè)務(wù)決策常常因?yàn)閿?shù)據(jù)沒(méi)有那么多,或者有時(shí)效性,容易變成拍腦袋的決策或慣性決策,或者比如讓經(jīng)驗(yàn)最豐富的人決定。但我們認(rèn)為,好的數(shù)據(jù)支撐能顯著提升決策的質(zhì)量。
在封閉場(chǎng)景下,Data Agent 已能很好地支持基于規(guī)則的自動(dòng)決策,甚至貫穿到執(zhí)行層。而在開(kāi)放場(chǎng)景中,產(chǎn)品的核心邏輯就是“懂業(yè)務(wù)”。Data Agent 會(huì)從業(yè)務(wù)語(yǔ)境出發(fā),結(jié)合內(nèi)部數(shù)據(jù)與接入的外部權(quán)威數(shù)據(jù),比如打通 Web 搜索,形成一個(gè)結(jié)構(gòu)化的分析報(bào)告。就像一個(gè)稱(chēng)職的秘書(shū),搜集齊所有資料,最終由業(yè)務(wù)決策者來(lái)做決定。
量子位:那作為數(shù)據(jù)庫(kù),有沒(méi)有辦法判斷 Agent 是否充分利用了數(shù)據(jù)?比如判斷數(shù)據(jù)是否缺失、錯(cuò)誤、沖突,或者評(píng)估數(shù)據(jù)的可靠性?
飛輪科技肖康:數(shù)據(jù)庫(kù)作為底層支撐系統(tǒng),本身不理解語(yǔ)義,職責(zé)主要是高效地組織和查詢(xún)數(shù)據(jù)。比如數(shù)據(jù)庫(kù)作為中央存儲(chǔ),整合了 SQL 網(wǎng)關(guān)、ES 數(shù)據(jù)等多個(gè)來(lái)源,有時(shí)還包括文檔數(shù)據(jù)。
數(shù)據(jù)庫(kù)可以輔助評(píng)估哪些數(shù)據(jù)被頻繁訪(fǎng)問(wèn),哪些使用較少,初步反映數(shù)據(jù)的使用價(jià)值。但判斷數(shù)據(jù)是否被“充分使用”以及使用是否“合理”,更多還要靠上層來(lái)評(píng)估。
數(shù)據(jù)庫(kù)層面也可以提供技術(shù)支持,比如通過(guò)慢查詢(xún)?nèi)罩九袛嗍欠袢狈λ饕⑹欠袷褂昧说托Р樵?xún)方式等。我們也在探索如何用更智能的方式幫助用戶(hù)更高效地使用數(shù)據(jù)庫(kù)。
量子位:在決策中往往涉及敏感或關(guān)鍵數(shù)據(jù),有什么方法可以在保證數(shù)據(jù)調(diào)用靈活的同時(shí)保障數(shù)據(jù)安全?
飛輪科技肖康:這就需要做好細(xì)致的數(shù)據(jù)權(quán)限控制。常見(jiàn)的做法是基于角色(RBAC)進(jìn)行權(quán)限設(shè)定,比如 CEO、一線(xiàn)員工、部門(mén)負(fù)責(zé)人擁有不同訪(fǎng)問(wèn)權(quán)限。我們可以控制用戶(hù)能訪(fǎng)問(wèn)哪些表、哪些字段,甚至可以精確到表格的某一行或某個(gè)單元格。
在像 SelectDB 和 Doris 這樣的系統(tǒng)中,這些都可以通過(guò)細(xì)粒度的權(quán)限控制表達(dá)出來(lái)。尤其在 AI 和 Agent 時(shí)代,這種安全控制非常關(guān)鍵。以往數(shù)據(jù)由少數(shù)人集中審批,甚至需要郵件申請(qǐng)來(lái)獲得數(shù)據(jù)權(quán)限。現(xiàn)在用戶(hù)可能只需跟 AI 聊天就能獲取數(shù)據(jù)。如果權(quán)限控制不到位,很容易造成數(shù)據(jù)泄露風(fēng)險(xiǎn)。
我們認(rèn)為對(duì)安全能力的要求,越控制到底層會(huì)越好。
量子位:數(shù)據(jù) Agent 是否能在某些環(huán)節(jié)完全替代人?
數(shù)勢(shì)科技譚李:目前談“完全替代人”還為時(shí)過(guò)早。關(guān)于大模型和 Agent 是否會(huì)替代人,其實(shí)我們更傾向于認(rèn)為它是在“增強(qiáng)人”。確實(shí),Data Agent 會(huì)替代一部分重復(fù)性強(qiáng)、基于規(guī)則的任務(wù),但會(huì)增強(qiáng)另一部分人的能力。越早擁抱 Data Agent 的人,就越可能成為“被增強(qiáng)的人”。
在封閉場(chǎng)景中,很多基于清晰規(guī)則的日常決策,完全可以由 Data Agent 自動(dòng)化完成。這其實(shí)不等于“替代人”,而是把重復(fù)、低價(jià)值的工作交給 Agent,人可以去做更重要的事。所以這涉及兩個(gè)層面:一是哪些決策可以由 Agent 自動(dòng)化執(zhí)行;二是 Data Agent 的引入會(huì)替代哪些人,又增強(qiáng)哪些人。
量子位:這會(huì)對(duì)未來(lái)企業(yè)組織結(jié)構(gòu)會(huì)帶來(lái)怎樣的影響?
數(shù)勢(shì)科技譚李:最近我們也在思考這個(gè)問(wèn)題。比如現(xiàn)在硅谷流行“超級(jí)個(gè)體”或“一人公司”的概念,本質(zhì)是各種 AI 工具擴(kuò)展了個(gè)體的能力。
過(guò)去可能需要團(tuán)隊(duì)完成的數(shù)據(jù)分析、報(bào)告生成、設(shè)計(jì)任務(wù),現(xiàn)在一個(gè)人就能搞定。比如用 Coding Agent 搭建網(wǎng)站、用 Data Agent 管賬戶(hù)、出報(bào)表,甚至用 Design Agent 做視覺(jué)設(shè)計(jì)。
這確實(shí)催生了“超級(jí)個(gè)體”,讓他們可以身兼多職。但這并不意味著數(shù)據(jù)分析師或設(shè)計(jì)師這些角色會(huì)消失。在大組織里,他們?nèi)匀恍枰V皇墙巧l(fā)生了變化。比如原來(lái)是“表哥表姐”的人,現(xiàn)在成了“電子牛馬飼養(yǎng)員”——一個(gè)高級(jí)分析師,管理成百上千個(gè) Agent,為各個(gè)業(yè)務(wù)線(xiàn)服務(wù)。
這時(shí)候?qū)δ闾岢龅囊缶透吡恕D阈枰龅氖蔷S護(hù)企業(yè)的數(shù)據(jù)質(zhì)量和數(shù)據(jù)語(yǔ)義,要聯(lián)合財(cái)務(wù)、銷(xiāo)售、商品等部門(mén)共創(chuàng)分析范式,并沉淀為 Agent 模板。
這些全新的任務(wù)在傳統(tǒng)范式下并不存在。所以并不是工作減少了,而是出現(xiàn)了新工作。只要你愿意擁抱大模型和 Agent,就能成為這種新范式下的核心角色,創(chuàng)造更大價(jià)值。這是我對(duì)未來(lái)的一個(gè)暢想。
量子位:隨著模型和數(shù)據(jù)技術(shù)的提升,數(shù)據(jù)和 AI 的關(guān)系也在變化。未來(lái)企業(yè)的智能化發(fā)展會(huì)更依賴(lài)更強(qiáng)的模型,還是更好的數(shù)據(jù)?
數(shù)勢(shì)科技譚李:我覺(jué)得這其實(shí)是一體兩面的——既要更好的數(shù)據(jù),也要更強(qiáng)的模型。我們目前在做企業(yè)級(jí)Data Agent時(shí),是暫不涉及基礎(chǔ)模型的研發(fā)的。我們更關(guān)注的是如何把更強(qiáng)的基礎(chǔ)模型與企業(yè)的私域數(shù)據(jù)結(jié)合起來(lái),打造更聰明、更能干的 Data Agent 或企業(yè)級(jí)智能體。
我們可以看到,現(xiàn)在底座模型在不斷迭代,更多企業(yè)級(jí)應(yīng)用在誕生,企業(yè)也越來(lái)越重視私域數(shù)據(jù)的積累與治理。這樣幾件事的疊加作用下,飛輪正在轉(zhuǎn)動(dòng)起來(lái)。未來(lái)我們將看到越來(lái)越多真正落地、有實(shí)際價(jià)值的 Data Agent 或更多應(yīng)用在企業(yè)場(chǎng)景中發(fā)揮作用。
飛輪科技肖康:我認(rèn)為,模型要發(fā)展,首先必須有更好的數(shù)據(jù)。數(shù)據(jù)是模型的基礎(chǔ)。大模型的顯著提升,從 GPT-3 開(kāi)始就是一個(gè)很好的例子。GPT-1 和 GPT-2 出現(xiàn)時(shí)并沒(méi)有引起太多關(guān)注,因?yàn)樗鼈冇?xùn)練所用的數(shù)據(jù)量和質(zhì)量還不夠,而到了 GPT-3,訓(xùn)練數(shù)據(jù)的數(shù)量級(jí)提升了好幾個(gè)層次,才帶來(lái)了質(zhì)變。
這是第一個(gè)階段,訓(xùn)練階段,大量高質(zhì)量數(shù)據(jù)決定了模型的能力。第二階段是落地應(yīng)用階段,也就是譚總提到的,大部分企業(yè)并不會(huì)再去自己訓(xùn)練模型,而是基于已有的大模型進(jìn)行應(yīng)用。無(wú)論是開(kāi)源模型的私有部署,還是調(diào)用已有模型的服務(wù)接口,關(guān)鍵在于如何將企業(yè)自己的數(shù)據(jù)與模型結(jié)合。
完成了第一階段的大模型就像是剛畢業(yè)的大學(xué)生,擁有通用能力,但對(duì)企業(yè)的業(yè)務(wù)流程、數(shù)據(jù)結(jié)構(gòu)一無(wú)所知,需要一定時(shí)間去適應(yīng)、學(xué)習(xí)。這時(shí)候企業(yè)的私域數(shù)據(jù)非常關(guān)鍵。我們通常分為兩類(lèi)數(shù)據(jù):一類(lèi)是文本知識(shí)庫(kù),來(lái)源于企業(yè)內(nèi)部的文檔、資料,用來(lái)做知識(shí)問(wèn)答;另一類(lèi)是結(jié)構(gòu)化數(shù)據(jù),也就是數(shù)據(jù)庫(kù)或數(shù)倉(cāng)中的業(yè)務(wù)數(shù)據(jù)。
所以,我認(rèn)為訓(xùn)練階段需要大量的高質(zhì)量數(shù)據(jù),企業(yè)落地應(yīng)用階段,也需要把企業(yè)私域數(shù)據(jù)的優(yōu)勢(shì)發(fā)揮出來(lái)。企業(yè)只有用好自己積累的數(shù)據(jù),才能真正讓 AI 發(fā)揮作用,否則無(wú)論模型多強(qiáng),部署也只是形式,和開(kāi)源模型沒(méi)本質(zhì)區(qū)別。
量子位:最后兩位嘉賓還有什么想要補(bǔ)充分享的?
數(shù)勢(shì)科技譚李:無(wú)論是我們今天聊的 Data + AI,還是其他 AI 應(yīng)用場(chǎng)景的落地,現(xiàn)在都在如火如荼地推進(jìn)中。作為從業(yè)者,每天都很興奮。
第一點(diǎn),我想強(qiáng)調(diào)心態(tài):我們應(yīng)該積極擁抱 AI。正如我們之前所說(shuō),AI agent 會(huì)替代一部分人,也會(huì)增強(qiáng)一部分人。我們應(yīng)該努力成為被增強(qiáng)的那部分。
第二點(diǎn),對(duì)企業(yè)來(lái)說(shuō),最關(guān)鍵的事情是兩件:一是把企業(yè)內(nèi)部的私域數(shù)據(jù)、語(yǔ)義系統(tǒng)真正治理好,才能驅(qū)動(dòng) AI 飛輪轉(zhuǎn)起來(lái);二是與業(yè)務(wù)結(jié)合,深入挖掘適合落地的 use case,讓技術(shù)與業(yè)務(wù)價(jià)值真正融合。
飛輪科技肖康:我覺(jué)得譚總說(shuō)得很好。我想強(qiáng)調(diào)一點(diǎn):AI 落地的過(guò)程,一定是一個(gè)不斷探索、不斷試錯(cuò)的過(guò)程。雖然現(xiàn)在大家都很興奮,認(rèn)為這是 AI 的新時(shí)代,但真正落地還需要大量實(shí)踐,去找到突破點(diǎn)。
在這個(gè)過(guò)程中,我認(rèn)為業(yè)務(wù)和平臺(tái)的聯(lián)合共建非常重要。業(yè)務(wù)方了解業(yè)務(wù)流程和價(jià)值,平臺(tái)方提供底層技術(shù)支持,包括數(shù)據(jù)庫(kù)、AI Agent 能力等。只有雙方不斷交流互動(dòng),平臺(tái)才能更精準(zhǔn)地滿(mǎn)足業(yè)務(wù)需求,技術(shù)能力也才能不斷增強(qiáng)。
因此也歡迎大家多與像數(shù)勢(shì)、SelectDB 這樣的數(shù)據(jù)平臺(tái)、數(shù)據(jù)庫(kù)公司多交流合作,一起把 AI 探索落地,在企業(yè)中真正用起來(lái)!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.