短短兩年時(shí)間,大模型在 SaaS 領(lǐng)域已呈現(xiàn)蓬勃發(fā)展的態(tài)勢(shì),創(chuàng)新應(yīng)用層出不窮,然而,在這繁榮景象背后,大模型的技術(shù)演進(jìn)、市場(chǎng)滲透、挑戰(zhàn)與機(jī)遇等,究竟是怎樣一番景象?
文|李揚(yáng);整理|李雪曼
短短兩年時(shí)間,大模型在 SaaS 領(lǐng)域已呈現(xiàn)蓬勃發(fā)展的態(tài)勢(shì),創(chuàng)新應(yīng)用層出不窮,然而,在這繁榮景象背后,大模型的技術(shù)演進(jìn)、市場(chǎng)滲透、挑戰(zhàn)與機(jī)遇等,究竟是怎樣一番景象?
11 月 16 日,在“2024 中國(guó) SaaS 大會(huì)”暨崔牛會(huì) 10 周年年會(huì)上,百度智能云大模型應(yīng)用生態(tài)合作總監(jiān)李揚(yáng),通過(guò)主題分享《大模型的這兩年》揭曉了答案。
AI 對(duì) SaaS 的影響,是一個(gè)備受關(guān)注的話題。至于,SaaS 不加 AI 會(huì)不會(huì)死?李揚(yáng)的觀點(diǎn)是:不會(huì)死。但與具備 AI 能力的競(jìng)品相比,無(wú)疑會(huì)存在明顯的短板。他解釋,今后,大模型能力會(huì)成為 SaaS 的標(biāo)配,其地位將等同于如今的數(shù)據(jù)庫(kù)。未來(lái),無(wú)論是在云端還是本地部署,大模型和數(shù)據(jù)庫(kù)將成為 SaaS 不可或缺的基礎(chǔ)設(shè)施。
李揚(yáng)表示, AI 對(duì) SaaS 行業(yè)的顛覆是不可避免的,只是時(shí)間早晚的問(wèn)題。至于是自身率先被顛覆,還是在這場(chǎng)變革中占據(jù)主動(dòng)、顛覆他人,這需要各位 SaaS 廠商的掌舵者們盡早投身于大模型技術(shù)的研究與探索之中,在變革中占據(jù)先機(jī)。
以下是經(jīng)牛透社整理的分享內(nèi)容:
AI 技術(shù)的融合已成為行業(yè)發(fā)展的必然趨勢(shì)。然而,當(dāng)所有企業(yè)都在這條道路上前進(jìn)時(shí),如何在眾多競(jìng)爭(zhēng)者中脫穎而出,構(gòu)建差異化優(yōu)勢(shì),如何筑起產(chǎn)品的競(jìng)爭(zhēng)壁壘,便成了大家當(dāng)前需要深思的問(wèn)題。
這兩年來(lái),整個(gè)行業(yè)呈現(xiàn)出一種鮮明的發(fā)展態(tài)勢(shì),總體可歸結(jié)為四個(gè)關(guān)鍵詞:快速爆發(fā)、極致內(nèi)卷、應(yīng)用為王、未來(lái)可期。
在這一背景下,大模型廠商與應(yīng)用伙伴之間的關(guān)系發(fā)生了顯著轉(zhuǎn)變。早期階段,應(yīng)用伙伴往往主動(dòng)向大模型廠商尋求技術(shù)支持,以實(shí)現(xiàn)大模型技術(shù)的快速引入。而現(xiàn)在,大模型廠商則積極尋求與應(yīng)用伙伴合作,致力于落地更具價(jià)值的場(chǎng)景與案例。可以預(yù)見,未來(lái)將是應(yīng)用引領(lǐng)大模型技術(shù)發(fā)展的時(shí)期。
SaaS廠商不要盲目跟風(fēng)做Agent平臺(tái)
這兩年,大模型行業(yè)的產(chǎn)品賽道與廠商分工逐漸明朗。回顧去年,國(guó)內(nèi)大模型廠商數(shù)量眾多,包括基礎(chǔ)模型與行業(yè)模型,總數(shù)超過(guò) 200 家。然而,時(shí)至今日,能夠持續(xù)迭代并在市場(chǎng)上保持活躍的廠商已大幅減少。
究其原因,一方面是由于基礎(chǔ)模型訓(xùn)練的資金壓力,另一方面是支撐基礎(chǔ)模型發(fā)展的 Scaling Law 出現(xiàn)明顯的邊際效應(yīng)遞減。因此,百度一直倡導(dǎo)將關(guān)注點(diǎn)轉(zhuǎn)向應(yīng)用層的創(chuàng)新。
在公有云領(lǐng)域,競(jìng)爭(zhēng)焦點(diǎn)已轉(zhuǎn)向大模型供應(yīng)商的成本管控能力,幾家頭部廠商已經(jīng)將大模型推理成本超前壓縮。所以對(duì)于 SaaS 伙伴來(lái)講,盡管大模型應(yīng)用的研發(fā)整體成本較高,但在應(yīng)用發(fā)布后的推理服務(wù)階段,成本是相對(duì)較低的,這也是大模型公有云服務(wù)的優(yōu)勢(shì)所在。
在另一個(gè)賽道,大模型領(lǐng)域還存在大量私有化項(xiàng)目,特別是今年年初央企大模型討論會(huì)召開以來(lái),所有央企都在著手構(gòu)建自己的行業(yè)大模型。
這些項(xiàng)目規(guī)模較大,一般整體建設(shè)金額都在千萬(wàn)級(jí)以上,涉及算力采購(gòu)、模型平臺(tái)搭建及應(yīng)用開發(fā)等多個(gè)環(huán)節(jié)。這一市場(chǎng)主要由模型廠商參與,與 SaaS 廠商關(guān)系不大。這是基礎(chǔ)模型商業(yè)化賽道的行業(yè)現(xiàn)狀。
在工具平臺(tái)領(lǐng)域,競(jìng)爭(zhēng)尤為激烈。當(dāng)前市場(chǎng)上涌現(xiàn)出眾多 Agent 平臺(tái),如百度智能云的 AppBuilder、字節(jié)的扣子、騰訊的元器等知名平臺(tái),另外還有諸如 Dify、Fast-GPT 等眾多優(yōu)秀的開源 Agent 平臺(tái)產(chǎn)品。
在這種市場(chǎng)格局下,還是有一些 SaaS 廠商也要自研 Agent 平臺(tái),個(gè)人覺(jué)得這個(gè)產(chǎn)品方向還是要仔細(xì)評(píng)估的。
因?yàn)樵S多現(xiàn)有 Agent 平臺(tái)都具備被集成的能力,SaaS 廠商還是應(yīng)該聚焦于自身擅長(zhǎng)的業(yè)務(wù)應(yīng)用,利用好通用 Agent 平臺(tái)的組件化能力做好集成就行,比如百度智能云的 App Builder 平臺(tái)就是基于 API-Centric 理念設(shè)計(jì)的,它的各種組件化能力可以被 SaaS 廠商方便集成調(diào)用,讓 SaaS 廠商更專注于其業(yè)務(wù)功能實(shí)現(xiàn)而非底層 AI 能力的跟進(jìn)與迭代。
總之,個(gè)人建議 SaaS 廠商在立項(xiàng)大模型平臺(tái)或 Agent 平臺(tái)之類的產(chǎn)品研發(fā)時(shí)一定要找準(zhǔn)定位,切勿陷入再次重復(fù)造輪子的陷阱,那將大幅增加研發(fā)成本并且拖后商業(yè)轉(zhuǎn)化周期。
在應(yīng)用層面,大模型的應(yīng)用大體可分為兩種類型:一是 AI 原生應(yīng)用,如文小言、AI PPT 這類,這類應(yīng)用的 AI 生成功能力占比極高,形成了獨(dú)立的市場(chǎng)賽道;二是在現(xiàn)有 SaaS 產(chǎn)品中融入大模型功能點(diǎn)的應(yīng)用,就是這兩天我們一直在討論的“+AI”。
這兩種路徑均被視為大模型應(yīng)用的可行方向,但我個(gè)人更關(guān)注后者,其原因是,盡管當(dāng)前在營(yíng)銷、客服等領(lǐng)域已有不少成功落地的應(yīng)用案例,但在更廣泛的業(yè)務(wù)場(chǎng)景中,大模型+在 SaaS 應(yīng)用的爆發(fā)時(shí)代還沒(méi)有到來(lái),“+AI”應(yīng)用前景依然廣闊。
值得注意的是,當(dāng)前還有不少大模型應(yīng)用場(chǎng)景普遍存在“淺、泛、浮”的現(xiàn)象,即應(yīng)用深度不足、場(chǎng)景泛化但缺乏針對(duì)性、以及浮于表面缺乏業(yè)務(wù)基礎(chǔ)。因此,我們 SaaS 廠商后面真正需要深入思考的,是如何構(gòu)建真正的門檻與壁壘,以提升大模型應(yīng)用的價(jià)值。
目前,相對(duì)落地的應(yīng)用場(chǎng)景都更貼近于大模型的原生能力,并且這些場(chǎng)景也較早地被客戶所采納。盡管如此,仍有大量客戶不愿為之買單,不想付費(fèi)。其實(shí),從我們監(jiān)測(cè)的大模型調(diào)用量來(lái)看,企業(yè)服務(wù)類的調(diào)用量確實(shí)不高。這背后的主要問(wèn)題在于,目前所開發(fā)的應(yīng)用場(chǎng)景尚未真正展現(xiàn)出其業(yè)務(wù)價(jià)值。業(yè)務(wù)價(jià)值未能體現(xiàn),主要?dú)w咎于兩方面的原因:
一方面,應(yīng)用場(chǎng)景對(duì)于原有應(yīng)用的功能效果提升不顯著。為了應(yīng)對(duì)這一問(wèn)題,我們需要積極尋求方法來(lái)提升這些應(yīng)用的實(shí)際效果。
另一方面,所開發(fā)的應(yīng)用場(chǎng)景可能缺乏實(shí)際意義,或者沒(méi)有市場(chǎng)需求,導(dǎo)致客戶缺乏為之付費(fèi)的動(dòng)力。在這種情況下,我們需要勇于創(chuàng)新,不斷探索新的應(yīng)用場(chǎng)景。
所以,提升應(yīng)用價(jià)值的方案無(wú)非兩條:優(yōu)化當(dāng)前大模型產(chǎn)品應(yīng)用效果以及突破高價(jià)值的大模型應(yīng)用業(yè)務(wù)場(chǎng)景。
大模型產(chǎn)品優(yōu)化:效果、性能與成本的三角平衡
這個(gè)話題就又來(lái)到了我們熟悉的“不可能三角”,但實(shí)際上大模型應(yīng)用確實(shí)要綜合考慮效果、性能和成本的綜合最優(yōu),這是任何一個(gè)大模型應(yīng)用產(chǎn)品成熟后都無(wú)法回避的問(wèn)題。
起初,當(dāng)然是效果優(yōu)先,SaaS 廠商會(huì)用最強(qiáng)的模型去完成產(chǎn)品驗(yàn)證。但當(dāng)產(chǎn)品發(fā)布并且推廣后,隨著用戶的增加和 Tokens 調(diào)用的攀升,大家就會(huì)同時(shí)關(guān)注到性能和成本問(wèn)題。畢竟參數(shù)量的差異量級(jí)與成本的差異量級(jí)相比,大參數(shù)量模型的成本是小參數(shù)量模型的十倍百倍,小參數(shù)量模型也能夠在經(jīng)過(guò) SFT 之后,在特定任務(wù)場(chǎng)景保障效果的前提下提供更優(yōu)的性能表現(xiàn)。
今天由于時(shí)間關(guān)系,我們主要說(shuō)一下模型評(píng)估、工程優(yōu)化和數(shù)據(jù)飛輪建設(shè)這三個(gè)話題:
大模型產(chǎn)品效果優(yōu)化首先要做的就是測(cè)試與評(píng)估。較為自然的一種方式是選取若干原型客戶,在實(shí)際應(yīng)用場(chǎng)景中進(jìn)行原型產(chǎn)品測(cè)試,并讓用戶對(duì)模型的表現(xiàn)進(jìn)行描述和評(píng)判。大模型產(chǎn)品效果的評(píng)估不同于傳統(tǒng)SaaS軟件產(chǎn)品,具有較強(qiáng)的主觀性,其核心在于輸出的內(nèi)容究竟能否滿足客戶的實(shí)際需求。
從根本上來(lái)說(shuō),大模型評(píng)估主要依賴專家評(píng)估法,也就是憑借特定的專業(yè)判斷來(lái)解決。但是,大模型的全部應(yīng)用場(chǎng)景都采用專家評(píng)估的方式是不現(xiàn)實(shí)的,不僅成本高昂,而且也沒(méi)有那么多專家資源,因此,我們也可以引入自動(dòng)化評(píng)估方法來(lái)輔助評(píng)估。
這里簡(jiǎn)單分享一下百度智能云產(chǎn)研團(tuán)隊(duì)歸納的《大模型產(chǎn)品評(píng)估測(cè)試白皮書》,是基于智能云內(nèi)部產(chǎn)品的評(píng)測(cè)工作總結(jié)的一套方法論。這里面會(huì)分層次分領(lǐng)域的給出不同大模型產(chǎn)品的評(píng)估建議,包括基礎(chǔ)模型、行業(yè)/領(lǐng)域模型等等。
大家可以看一下這個(gè)面向金融行業(yè)的“智金”平臺(tái)(智金是百度智能云面向金融行業(yè)場(chǎng)景發(fā)布的大模型智能體產(chǎn)品,可以提供資產(chǎn)智評(píng)、合規(guī)智判、交易智查、財(cái)務(wù)智顧等業(yè)務(wù)場(chǎng)景的智能體服務(wù))的效果評(píng)估流程,已經(jīng)基本自動(dòng)化了。
簡(jiǎn)單概括就是將大模型輸出的內(nèi)容“切片評(píng)估”之后再“匯總得分”,從而快速實(shí)現(xiàn)一個(gè)測(cè)試內(nèi)容的對(duì)標(biāo)評(píng)估,找到差異部分之后可以進(jìn)入下一階段的優(yōu)化與對(duì)齊流程。
評(píng)估后如果效果不盡如人意,那么第一個(gè)需要考慮的就是工程框架問(wèn)題。產(chǎn)品的 COT 是否完備,RAG 的準(zhǔn)召率是否達(dá)標(biāo),API 調(diào)用是否穩(wěn)定,等等。說(shuō)起大模型應(yīng)用開發(fā)框架大家可能第一個(gè)想到的是 LangChain、LlamaIndex 等老牌開源框架,不過(guò),當(dāng)前大模型開發(fā)平臺(tái)/框架的產(chǎn)品生態(tài)已經(jīng)是非常豐富了,既有大廠的閉源產(chǎn)品,也有優(yōu)秀的開源產(chǎn)品可以選擇。
因此,建議各位 SaaS 廠商在考慮自研大模型產(chǎn)品時(shí)多去利用成熟的平臺(tái)能力,以百度智能云千帆 AppBuilder 為例,它不但提供了多種產(chǎn)品集成形態(tài)選擇,還提供了大量的 AI 能力組件,而且背靠百度智能云的算力服務(wù),可以實(shí)現(xiàn)從研發(fā)環(huán)境到生產(chǎn)環(huán)境的平滑遷移。
大模型產(chǎn)品優(yōu)化的第二個(gè)也是最重要的思路,就是一定要構(gòu)建自身領(lǐng)域的數(shù)據(jù)飛輪。從邏輯上講,真正有競(jìng)爭(zhēng)壁壘的大模型產(chǎn)品到最后肯定依賴于 SaaS 廠商自身的數(shù)據(jù)積累和業(yè)務(wù) Know-How,承載這些競(jìng)爭(zhēng)壁壘的應(yīng)該就是基于這些數(shù)據(jù)訓(xùn)練出來(lái)的“領(lǐng)域/場(chǎng)景模型”了,將用戶反饋的數(shù)據(jù)高效回流、標(biāo)注、對(duì)齊從而不斷迭代模型能力的過(guò)程我們稱之為“數(shù)據(jù)飛輪”。
構(gòu)建數(shù)據(jù)飛輪的過(guò)程中由于存在很多需要資源投入的作業(yè)節(jié)點(diǎn),比如標(biāo)注、對(duì)齊的環(huán)節(jié),有些 SaaS 廠商也是由于這些節(jié)點(diǎn)的資源投入較多,在構(gòu)建數(shù)據(jù)飛輪上一直存在卡點(diǎn)。
這里介紹一下百度建議的數(shù)據(jù)飛輪構(gòu)建方法,就是基于百度智能云千帆 ModelBuilder 平臺(tái)實(shí)現(xiàn)數(shù)據(jù)流程的閉環(huán)以及對(duì)齊訓(xùn)練的自動(dòng)化。
以面試總結(jié)這個(gè)場(chǎng)景為例,我們基于業(yè)務(wù)需求規(guī)劃了 4 輪自動(dòng)化的訓(xùn)練流程,基于知識(shí)蒸餾的方法,使用一個(gè)大參數(shù)模型作為 teacher 模型,同時(shí)引入一個(gè)小參數(shù)模型作為 student 模型。通過(guò)不斷迭代和優(yōu)化語(yǔ)料庫(kù),實(shí)現(xiàn)模型的自動(dòng)與升級(jí),這是整個(gè)流程的基本框架。
在訓(xùn)練流程中,語(yǔ)料篩選至關(guān)重要。為了提升訓(xùn)練效果并降低成本,我們引入了“語(yǔ)義熵”的概念,在篩選語(yǔ)料時(shí)優(yōu)先考慮語(yǔ)義差異性較大的數(shù)據(jù)。這種方法不僅提高了訓(xùn)練效率,還顯著降低了成本。
還是面試總結(jié)這個(gè)場(chǎng)景,分別以文心 4 和文心 speed 做為 teacher 模型和 student 模型,文心 4 是我們效果最好的萬(wàn)億參數(shù)的模型,而文心 speed 則是一個(gè)擁有 200 億參數(shù)的高性能模型。
基于上文的機(jī)制經(jīng)過(guò)四輪的訓(xùn)練,文心 speed 的表現(xiàn)效果便能超越文心4。
大模型應(yīng)用場(chǎng)景創(chuàng)新的建議方向
關(guān)于大模型應(yīng)用場(chǎng)景的創(chuàng)新,真正的路徑最終肯定是由大模型應(yīng)用伙伴探索出來(lái)的,在此,分享幾個(gè)探索方向的思路:
首先,深入挖掘企業(yè)的核心應(yīng)用場(chǎng)景。企業(yè)的戰(zhàn)略、研發(fā)、生產(chǎn)、供應(yīng)、銷售和服務(wù)等各個(gè)環(huán)節(jié),都是值得探索的領(lǐng)域。特別是戰(zhàn)略、計(jì)劃和研發(fā)這些相對(duì)較為復(fù)雜的領(lǐng)域,大模型技術(shù)能否在其中發(fā)揮獨(dú)特的作用,或者能否與傳統(tǒng)模型相結(jié)合,創(chuàng)造出新的解決方案,這是值得深入思考和探索的。
舉例來(lái)說(shuō),隨著大模型進(jìn)化到 System2,意味著可以嘗試更多低頻、復(fù)雜的計(jì)算場(chǎng)景。比如企業(yè)經(jīng)營(yíng)中的各類計(jì)劃場(chǎng)景,能否依賴基于強(qiáng)化學(xué)習(xí)深度推理的大模型實(shí)現(xiàn)業(yè)務(wù)建模?然后再靈活的調(diào)用其他統(tǒng)籌決策工具,比如求解器之類的產(chǎn)品,最終實(shí)現(xiàn)整體計(jì)劃的規(guī)劃與發(fā)布,這是個(gè)值得探討的高價(jià)值場(chǎng)景。
其次,隨著大模型的普及,圖形用戶界面(GUI)到語(yǔ)言用戶界面(LUI)的應(yīng)用轉(zhuǎn)化已成為一個(gè)不可忽視的趨勢(shì)。最近 Claude 發(fā)布的一些場(chǎng)景應(yīng)用中,大模型已經(jīng)可以控制 PC 用戶在采購(gòu)系統(tǒng)中自行錄入訂單添加大量表單,這是與傳統(tǒng) RPA 完全不同原理的實(shí)現(xiàn)方式,這種變化給我們帶來(lái)了新的啟示。
此外,之前展示過(guò)的利用大模型自動(dòng)操控手機(jī)的演示,也為我們提供了基于大模型實(shí)現(xiàn)從計(jì)算機(jī)自動(dòng)化應(yīng)用(Computer Use)、智能終端手機(jī)自動(dòng)化應(yīng)用(Mobile Use)拓展到系統(tǒng)自動(dòng)化應(yīng)用(System Use)的新思路。
第三,多智能體協(xié)作的概念也為我們提供了場(chǎng)景創(chuàng)新的新視角。單個(gè)智能體可以完成一個(gè)小任務(wù),而多個(gè)智能體協(xié)作則可以完成更為復(fù)雜、需要協(xié)同的工作任務(wù)。
多智能體協(xié)作模式
以企業(yè)物料采購(gòu)流程為例,它的很多環(huán)節(jié)可以通過(guò)既定規(guī)則或者自動(dòng)化溝通方式來(lái)實(shí)現(xiàn)。這里所涉及的主要是企業(yè)內(nèi)部智能體的運(yùn)作情況。
而從產(chǎn)業(yè)鏈的視角來(lái)看,當(dāng)企業(yè)外部的供應(yīng)商也引入銷售智能體來(lái)響應(yīng)企業(yè)內(nèi)部采購(gòu)智能體的需求時(shí),整個(gè)產(chǎn)業(yè)鏈便能夠?qū)崿F(xiàn)有效銜接與協(xié)同運(yùn)作,這便是多智能體協(xié)作在實(shí)際場(chǎng)景中的生動(dòng)體現(xiàn)。對(duì)于 SCRM 這類供應(yīng)鏈平臺(tái)廠商而言,多智能體協(xié)作模式很值得嘗試。
SaaS不加AI不會(huì)“死”
關(guān)于 AI 對(duì) SaaS 的影響,這是一個(gè)備受關(guān)注的話題。雖然 AI 能否顛覆 SaaS 取決于人們的認(rèn)知角度,但不可否認(rèn)的是,AI 必將給 SaaS帶來(lái)顯著的變化。
首先,AI 正朝著類人化的方向發(fā)展,未來(lái)它將成為我們的同事,與我們進(jìn)行自然語(yǔ)言溝通協(xié)作。其次,即使 AI 成為了“同事”,現(xiàn)有的人類同事也不會(huì)被淘汰。相反,他們將轉(zhuǎn)變?yōu)?AI 的“教練”,負(fù)責(zé)維護(hù)和優(yōu)化 AI 的業(yè)務(wù)邏輯、業(yè)務(wù)數(shù)據(jù)以及數(shù)據(jù)飛輪等核心要素。最后,隨著 AI 技術(shù)的不斷發(fā)展,整個(gè)業(yè)務(wù)流程都將逐步走向 AI 化。無(wú)論處于何種應(yīng)用場(chǎng)景之中,AI 都將為人們提供全面的支持和解決方案。
至于,SaaS 不加 AI 會(huì)不會(huì)死?我的觀點(diǎn)是:不會(huì)死。但與具備 AI 能力的競(jìng)品相比,無(wú)疑會(huì)存在明顯的短板。今后,大模型能力會(huì)成為 SaaS 的標(biāo)配,其地位將等同于如今的數(shù)據(jù)庫(kù)。未來(lái),無(wú)論是在云端還是本地部署,大模型和數(shù)據(jù)庫(kù)將成為 SaaS 不可或缺的基礎(chǔ)設(shè)施。
我認(rèn)為, AI 對(duì) SaaS 行業(yè)的顛覆是不可避免的,只是時(shí)間早晚的問(wèn)題。至于是自身率先被顛覆,還是在這場(chǎng)變革中占據(jù)主動(dòng)、顛覆他人,這需要各位 SaaS 廠商的掌舵者們盡早投身于大模型技術(shù)的研究與探索之中,在變革中占據(jù)先機(jī)。
說(shuō)明:文章為牛透社原創(chuàng),未經(jīng)允許謝絕轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.