“飛書想建立AI產(chǎn)品分級(jí)體系,它的底氣是什么?
2025年,AI幾乎無處不在。從智能助理到AI會(huì)議紀(jì)要,幾乎每一家To B軟件公司都在快速疊加AI能力,爭(zhēng)搶“AI+辦公”的未來入場(chǎng)券。對(duì)企業(yè)而言,仿佛不接入AI,就像還在用功能機(jī)時(shí)代的辦公系統(tǒng)。
但熱鬧背后,越來越多企業(yè)管理者陷入一種“AI疲勞”:許多AI功能看起來令人驚艷,真正上線使用后,卻不是響應(yīng)緩慢、就是內(nèi)容敷衍,甚至完全“答非所問”。AI產(chǎn)品成了企業(yè)的“PPT裝飾”,更像是為發(fā)布會(huì)準(zhǔn)備的“賣家秀”,而非真正解決業(yè)務(wù)難題的“工具人”。
一句話,企業(yè)到底該如何判斷一個(gè)AI功能是“好看”還是“好用”?
就在這股技術(shù)與焦慮交織的洪流中,飛書在其2025年7月的發(fā)布會(huì)上,拋出一個(gè)頗具分量的新概念——AI應(yīng)用成熟度模型。這是一套將企業(yè)AI應(yīng)用劃分為四個(gè)成熟度等級(jí)的評(píng)價(jià)標(biāo)準(zhǔn),試圖用清晰可量化的標(biāo)準(zhǔn),把“AI好不好用”這件事,從主觀感知拉回理性評(píng)估。
M1–M4四個(gè)等級(jí)到底怎么分?
“AI應(yīng)用成熟度模型”這一術(shù)語,聽起來略帶技術(shù)門檻,卻準(zhǔn)確擊中了當(dāng)前To B企業(yè)面臨的一大現(xiàn)實(shí):AI到底該怎么評(píng)估?在產(chǎn)品頁面“寫得天花亂墜”、實(shí)操落地“一地雞毛”的今天,飛書嘗試用一套四級(jí)分類,把“能演示”和“能用”這道鴻溝,正式劃清。
四個(gè)等級(jí),一眼看懂企業(yè)AI的“進(jìn)化路徑”:
為了幫助大家更好理解模型,我們對(duì)其做了一些“翻譯”,并做了下面表格:
這四個(gè)階段的劃分邏輯,不是根據(jù)模型大小、算法復(fù)雜度,而是站在企業(yè)使用者視角:你能不能上線用?能不能持續(xù)用?用完有沒有實(shí)際業(yè)務(wù)提升?
與“科研AI”劃界,飛書想強(qiáng)調(diào)的是“落地工程性”。
傳統(tǒng)AI領(lǐng)域有很多技術(shù)評(píng)估維度,比如BLEU分?jǐn)?shù)、推理速度、參數(shù)量等等,但對(duì)企業(yè)CIO或業(yè)務(wù)負(fù)責(zé)人來說,這些術(shù)語常常只是“玄學(xué)”。飛書模型的突破之處在于,它用非常貼近“業(yè)務(wù)落地感”的語言和等級(jí),把AI的實(shí)用性顆粒度做了拆解。
換句話說,這是一個(gè)從產(chǎn)品視角出發(fā)的AI評(píng)估標(biāo)準(zhǔn),不是技術(shù)人之間的炫技,而是業(yè)務(wù)人與工具之間的契約。
為什么企業(yè)AI需要“成熟度模型”?
AI正在從技術(shù)奇觀變成生產(chǎn)工具,但一個(gè)被忽視的問題是:我們拿什么來判斷一款A(yù)I產(chǎn)品,是否值得在企業(yè)中大規(guī)模部署?
在消費(fèi)級(jí)市場(chǎng),用戶靠“好不好玩”“用著爽不爽”來評(píng)估AI,而在企業(yè)級(jí)市場(chǎng),沒有任何一個(gè)CIO會(huì)用“科技感”來作為選型依據(jù)。他們更在乎的是:能不能快速上線?能不能跟現(xiàn)有系統(tǒng)打通?用完之后,是錦上添花,還是雪上加霜?
然而現(xiàn)實(shí)是,大量企業(yè)AI產(chǎn)品還停留在“展示即結(jié)束”的階段。很多廠商為了追熱點(diǎn),倉促將通用大模型能力包裹進(jìn)現(xiàn)有產(chǎn)品,PPT上是“AI驅(qū)動(dòng)”,真正使用時(shí)卻是:“問了三遍,還答非所問;總結(jié)了一頁,會(huì)后沒人敢用。”
這正是企業(yè)AI落地的“賣家秀–買家秀”悖論。
☆成熟度模型的意義在于:用一把“應(yīng)用標(biāo)尺”,重建信任
飛書提出M1–M4四級(jí)成熟度模型,其實(shí)在做一件至關(guān)重要的事:把企業(yè)對(duì)AI的期望值校準(zhǔn),把供應(yīng)商對(duì)交付能力的承諾標(biāo)準(zhǔn)化。
從“只講模型參數(shù)”到“講清產(chǎn)品可用性”,這本質(zhì)上是一次視角的轉(zhuǎn)變:
對(duì)企業(yè)用戶來說,成熟度模型讓他們可以設(shè)定合理預(yù)期,不再被“AI萬金油”式銷售術(shù)語蒙蔽;
對(duì)產(chǎn)品設(shè)計(jì)者來說,模型變成研發(fā)路線圖,知道什么是合格的交付標(biāo)準(zhǔn);
對(duì)整個(gè)市場(chǎng)來說,這是一次從“無標(biāo)可循”走向“共識(shí)定義”的進(jìn)化。
飛書不是第一個(gè)嘗試分類模型的公司,但它的特別之處在于——這次不是實(shí)驗(yàn)室發(fā)布的技術(shù)論文,而是一家實(shí)際運(yùn)營(yíng)AI產(chǎn)品的公司,站在一線,把模型與產(chǎn)品逐一綁定、現(xiàn)場(chǎng)驗(yàn)證。
這讓這個(gè)模型的意義,不只是理論,更具有“工程實(shí)操價(jià)值”。
模型不是空談,
飛書用產(chǎn)品一一對(duì)標(biāo)成熟度等級(jí)
相比空泛的概念模型,飛書更具說服力的一點(diǎn)在于,它同步公布了多款A(yù)I產(chǎn)品,飛書不是停留在“講模型”,而是用產(chǎn)品去定義模型、驗(yàn)證模型。下面,我們來看幾個(gè)此次飛書發(fā)布的產(chǎn)品,并試圖將其與上面的AI應(yīng)用成熟度模型對(duì)應(yīng)起來。
☆M3標(biāo)準(zhǔn):飛書知識(shí)問答——你的“企業(yè)豆包”
根據(jù)官方材料,飛書知識(shí)問答已達(dá)到M3級(jí),即“成熟應(yīng)用、可以大規(guī)模使用”。
無需企業(yè)構(gòu)建知識(shí)庫,即可“開箱即用”;
能“穿透組織”,理解語境,提供基于企業(yè)內(nèi)部信息的準(zhǔn)確回答;
就像是一個(gè)理解公司全貌、能回答“企業(yè)問題”的“企業(yè)豆包”。
這意味著,知識(shí)問答具備跨部門、跨角色使用的穩(wěn)定性,是一個(gè)可廣泛部署的AI“助手型”產(chǎn)品。
☆M4標(biāo)準(zhǔn):飛書會(huì)議——實(shí)時(shí)總結(jié)的成熟AI
飛書會(huì)議達(dá)到M4標(biāo)準(zhǔn),屬于“完全成熟,在適合的任何場(chǎng)景都可使用”的產(chǎn)品。該產(chǎn)品支持會(huì)中實(shí)時(shí)總結(jié),而非僅在會(huì)后回顧;能自動(dòng)生成紀(jì)要、輸出待辦事項(xiàng),并通過文檔發(fā)送;準(zhǔn)確率與邏輯概括能力“相當(dāng)成熟”。
這表明飛書會(huì)議不僅能聽懂,還能“提煉”、“記錄”并“執(zhí)行”后續(xù)任務(wù),是典型的高成熟度AI產(chǎn)品形態(tài)。
此外,飛書還發(fā)布或升級(jí)了多個(gè)具備AI能力的產(chǎn)品,也在逐步靠近M3及以上標(biāo)準(zhǔn)。
☆多維表格:功能躍遷中的“王牌產(chǎn)品”
雖然飛書未明確將“多維表格”歸入成熟度模型等級(jí),但從其產(chǎn)品更新幅度來看,它正向M3級(jí)靠近:月活接近千萬,標(biāo)志其邁入成熟工具產(chǎn)品品類;支持“拖拉拽”搭建業(yè)務(wù)系統(tǒng),兼顧美觀與實(shí)用;單表容量達(dá)1000萬熱行。
這使得多維表格不僅是表單工具,更開始具備“業(yè)務(wù)平臺(tái)”的潛質(zhì),對(duì)小微企業(yè)與大型流程管理者都構(gòu)成實(shí)際可用價(jià)值。
此外,飛書還推出了AI開發(fā)套件,形成了更系統(tǒng)的企業(yè)AI能力框架。
?飛書妙搭(企業(yè)AI系統(tǒng)搭建工具)
該產(chǎn)品讓AI Coding快速落地產(chǎn)品思考,類比為“企業(yè)的無限產(chǎn)品經(jīng)理和初階開發(fā)人員”,可自動(dòng)輸出原型、生成系統(tǒng)。
?飛書Aily+aPaaS平臺(tái)
Aily為企業(yè)級(jí)Agent平臺(tái),已在公牛集團(tuán)、美中愛瑞等公司落地;aPaaS平臺(tái)實(shí)現(xiàn)AI加持的PaaS化開發(fā),強(qiáng)調(diào)“效率、穩(wěn)定、復(fù)用”的平衡
這些構(gòu)成了飛書在更深層次的AI基礎(chǔ)設(shè)施布局,雖然未在材料中明確打標(biāo)簽,但顯然是朝著高成熟度、高擴(kuò)展性方向演進(jìn)的產(chǎn)品組合。
AI的“L1-L5”時(shí)刻到了嗎?
飛書模型的行業(yè)意義與市場(chǎng)震動(dòng)
自動(dòng)駕駛行業(yè)早在數(shù)年前就確立了一套全行業(yè)通用的分級(jí)模型:L1到L5,定義了從人類輔助到完全無人駕駛的五個(gè)階段。這套模型并不僅僅是技術(shù)評(píng)估標(biāo)準(zhǔn),它在根本上重新組織了整個(gè)產(chǎn)業(yè)鏈——幫助監(jiān)管者判斷風(fēng)險(xiǎn)、幫助企業(yè)評(píng)估能力邊界,也幫助公眾建立對(duì)“自動(dòng)化”的現(xiàn)實(shí)認(rèn)知。可以說,沒有L模型,就沒有今天自動(dòng)駕駛的理性競(jìng)爭(zhēng)格局。
而飛書此次提出的“M1–M4 AI應(yīng)用成熟度模型”,在本質(zhì)上正是對(duì)企業(yè)AI落地路徑的一次結(jié)構(gòu)化、工程化重構(gòu)。這不僅是一個(gè)模型發(fā)布,更可能是“企業(yè)級(jí)AI”真正走向成熟產(chǎn)業(yè)階段的標(biāo)志性事件。
☆模型之于產(chǎn)業(yè),不是修辭,是基礎(chǔ)設(shè)施
飛書模型的提出,首先是一種對(duì)當(dāng)下AI產(chǎn)品泛濫但落地稀缺現(xiàn)象的清算。在過去一年中,企業(yè)面對(duì)AI時(shí),往往只能依賴“演示效果”和“銷售口徑”來判斷其價(jià)值,而非清晰的標(biāo)準(zhǔn)。飛書此次以“M3=成熟可用、M4=全面通用”的方式,給出了明確的能力刻度。這種能力刻度,不是技術(shù)參數(shù)維度的“token長(zhǎng)度”或“訓(xùn)練數(shù)據(jù)規(guī)模”,而是以“可大規(guī)模部署”和“適配多場(chǎng)景”的可用性為核心,強(qiáng)調(diào)真實(shí)環(huán)境下的穩(wěn)定性、泛化能力與交付效果。
換句話說,它不問模型能不能生成“驚艷內(nèi)容”,而是問:這個(gè)AI功能在公司里能不能頂?shù)米?shí)際使用?能不能連續(xù)跑?出錯(cuò)率多高?
這正是To B場(chǎng)景下最需要的理性衡量方式。也正因如此,飛書模型與L模型之間產(chǎn)生了共振:它們都嘗試將“看不見的智能系統(tǒng)”拉入可以評(píng)估、可以管理、可以決策的框架之中,賦予市場(chǎng)真實(shí)的參考體系。
☆飛書想做的,是定義“可信AI”的使用上限
更深層次看,飛書通過這套模型的意圖并非只是幫助客戶選型,而是試圖建立企業(yè)AI應(yīng)用的行業(yè)標(biāo)準(zhǔn)語法。在一個(gè)尚無權(quán)威機(jī)構(gòu)給出通用評(píng)估體系的市場(chǎng)中,誰先給出一套被驗(yàn)證、被采用的結(jié)構(gòu)化標(biāo)準(zhǔn),誰就擁有了定義未來的先手權(quán)。
從發(fā)布會(huì)披露的信息來看,飛書并不是“模型先行、產(chǎn)品隨后”,而是反其道而行之:用多個(gè)真實(shí)產(chǎn)品(知識(shí)問答、AI會(huì)議、多維表格等)作為標(biāo)準(zhǔn)“標(biāo)桿”,反向映射出這一模型的四級(jí)結(jié)構(gòu)。這種從底層產(chǎn)品能力抽象模型的路徑,比憑空建構(gòu)模型更有操作性,也更容易贏得行業(yè)信任。
它背后折射的是飛書團(tuán)隊(duì)對(duì)“工程視角AI”的理解——AI產(chǎn)品不是創(chuàng)意、不是賣相,而是一套能承載組織信任的生產(chǎn)工具。
☆企業(yè)級(jí)AI的下一階段,需要共識(shí)而非炫技
一個(gè)重要的判斷是:飛書這次的模型發(fā)布,將會(huì)引發(fā)AI工具廠商之間的“成熟度競(jìng)賽”。就像自動(dòng)駕駛廠商不能再用“我們很先進(jìn)”一筆帶過L幾級(jí)一樣,未來AI產(chǎn)品也將無法僅憑一句“用了大模型”就獲得企業(yè)青睞。客戶會(huì)開始反問:你們是M幾?在哪些場(chǎng)景部署了?準(zhǔn)確率多少?穩(wěn)定性如何?
這對(duì)市場(chǎng)生態(tài)是一種積極的“清場(chǎng)效應(yīng)”。它迫使廠商從“炫技”回到“交付”,從“拼參數(shù)”回到“拼耐用度”。
而這,正是一個(gè)行業(yè)走向真正成熟的開端。
你的AI,用到了第幾層?
AI正從“demo吸睛”走向“場(chǎng)景決勝”的階段。當(dāng)越來越多的企業(yè)開始意識(shí)到:AI真正的價(jià)值不是能生成一段漂亮的文本、畫一幅驚艷的圖,而是能否在流程中持續(xù)穩(wěn)定地產(chǎn)生價(jià)值時(shí),我們其實(shí)已站在一個(gè)全新時(shí)代的門檻上。
飛書提出的“M1–M4 AI應(yīng)用成熟度模型”可能不是完美的答案,但它的出現(xiàn),至少為長(zhǎng)期混沌不清的“企業(yè)AI落地標(biāo)準(zhǔn)”提供了一個(gè)結(jié)構(gòu)化的起點(diǎn)。
這個(gè)模型的意義,不止在于幫助飛書解釋自己的產(chǎn)品,也不僅僅是一次品牌自證,更像是一面行業(yè)鏡子——它讓企業(yè)有機(jī)會(huì)回過頭來問自己:
我們現(xiàn)在用的AI功能,真的是在解決問題,還是只是在展示技術(shù)?
我們花了大量預(yù)算接入AI,它在日常的流程中真正發(fā)揮了多少作用?
我們是否有評(píng)估一款A(yù)I系統(tǒng)“好不好用”的標(biāo)準(zhǔn),而不是“新不新鮮”的情緒?
在AI從“先鋒試驗(yàn)”向“主流基礎(chǔ)設(shè)施”轉(zhuǎn)變的當(dāng)下,這些問題值得每一個(gè)企業(yè)決策者、產(chǎn)品經(jīng)理甚至一線員工思考。
如果你所在的企業(yè),已經(jīng)部署了多種AI應(yīng)用,不妨回看一下你們的工具清單,用“M1–M4”的視角去做一場(chǎng)自測(cè):哪些功能可以稱為成熟應(yīng)用?又有哪些,其實(shí)還停留在“演示”階段?
而如果你是一個(gè)在思考AI產(chǎn)品設(shè)計(jì)或采購路徑的從業(yè)者,不妨把飛書這次的模型作為一個(gè)“起點(diǎn)模板”——未必非要照搬,但至少,它給出了一個(gè)可以被溝通、可以被質(zhì)詢的語言系統(tǒng)。
企業(yè)AI的未來,屬于那些“最能穩(wěn)定服務(wù)流程、最能交付真實(shí)價(jià)值”的系統(tǒng)。飛書這次邁出的是定義標(biāo)準(zhǔn)的第一步,接下來要回答的問題,將是:誰能持續(xù)站在M3與M4之上?誰能用產(chǎn)品把成熟度走成護(hù)城河?
你的AI,現(xiàn)在用到了第幾層?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.