網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

飛書搞了個(gè)AI分級(jí)體系，一上線就把一堆產(chǎn)品打回原形了

2025-07-10 19:32:30　來源: 數(shù)據(jù)猿DataYuan

湖南舉報(bào)

分享至

“飛書想建立AI產(chǎn)品分級(jí)體系，它的底氣是什么？

2025年，AI幾乎無處不在。從智能助理到AI會(huì)議紀(jì)要，幾乎每一家To B軟件公司都在快速疊加AI能力，爭(zhēng)搶“AI+辦公”的未來入場(chǎng)券。對(duì)企業(yè)而言，仿佛不接入AI，就像還在用功能機(jī)時(shí)代的辦公系統(tǒng)。

但熱鬧背后，越來越多企業(yè)管理者陷入一種“AI疲勞”：許多AI功能看起來令人驚艷，真正上線使用后，卻不是響應(yīng)緩慢、就是內(nèi)容敷衍，甚至完全“答非所問”。AI產(chǎn)品成了企業(yè)的“PPT裝飾”，更像是為發(fā)布會(huì)準(zhǔn)備的“賣家秀”，而非真正解決業(yè)務(wù)難題的“工具人”。

一句話，企業(yè)到底該如何判斷一個(gè)AI功能是“好看”還是“好用”？

就在這股技術(shù)與焦慮交織的洪流中，飛書在其2025年7月的發(fā)布會(huì)上，拋出一個(gè)頗具分量的新概念——AI應(yīng)用成熟度模型。這是一套將企業(yè)AI應(yīng)用劃分為四個(gè)成熟度等級(jí)的評(píng)價(jià)標(biāo)準(zhǔn)，試圖用清晰可量化的標(biāo)準(zhǔn)，把“AI好不好用”這件事，從主觀感知拉回理性評(píng)估。

M1–M4四個(gè)等級(jí)到底怎么分？

“AI應(yīng)用成熟度模型”這一術(shù)語，聽起來略帶技術(shù)門檻，卻準(zhǔn)確擊中了當(dāng)前To B企業(yè)面臨的一大現(xiàn)實(shí)：AI到底該怎么評(píng)估？在產(chǎn)品頁面“寫得天花亂墜”、實(shí)操落地“一地雞毛”的今天，飛書嘗試用一套四級(jí)分類，把“能演示”和“能用”這道鴻溝，正式劃清。

四個(gè)等級(jí)，一眼看懂企業(yè)AI的“進(jìn)化路徑”：

為了幫助大家更好理解模型，我們對(duì)其做了一些“翻譯”，并做了下面表格：

這四個(gè)階段的劃分邏輯，不是根據(jù)模型大小、算法復(fù)雜度，而是站在企業(yè)使用者視角：你能不能上線用？能不能持續(xù)用？用完有沒有實(shí)際業(yè)務(wù)提升？

與“科研AI”劃界，飛書想強(qiáng)調(diào)的是“落地工程性”。

傳統(tǒng)AI領(lǐng)域有很多技術(shù)評(píng)估維度，比如BLEU分?jǐn)?shù)、推理速度、參數(shù)量等等，但對(duì)企業(yè)CIO或業(yè)務(wù)負(fù)責(zé)人來說，這些術(shù)語常常只是“玄學(xué)”。飛書模型的突破之處在于，它用非常貼近“業(yè)務(wù)落地感”的語言和等級(jí)，把AI的實(shí)用性顆粒度做了拆解。

換句話說，這是一個(gè)從產(chǎn)品視角出發(fā)的AI評(píng)估標(biāo)準(zhǔn)，不是技術(shù)人之間的炫技，而是業(yè)務(wù)人與工具之間的契約。

為什么企業(yè)AI需要“成熟度模型”？

AI正在從技術(shù)奇觀變成生產(chǎn)工具，但一個(gè)被忽視的問題是：我們拿什么來判斷一款A(yù)I產(chǎn)品，是否值得在企業(yè)中大規(guī)模部署？

在消費(fèi)級(jí)市場(chǎng)，用戶靠“好不好玩”“用著爽不爽”來評(píng)估AI，而在企業(yè)級(jí)市場(chǎng)，沒有任何一個(gè)CIO會(huì)用“科技感”來作為選型依據(jù)。他們更在乎的是：能不能快速上線？能不能跟現(xiàn)有系統(tǒng)打通？用完之后，是錦上添花，還是雪上加霜？

然而現(xiàn)實(shí)是，大量企業(yè)AI產(chǎn)品還停留在“展示即結(jié)束”的階段。很多廠商為了追熱點(diǎn)，倉促將通用大模型能力包裹進(jìn)現(xiàn)有產(chǎn)品，PPT上是“AI驅(qū)動(dòng)”，真正使用時(shí)卻是：“問了三遍，還答非所問；總結(jié)了一頁，會(huì)后沒人敢用。”

這正是企業(yè)AI落地的“賣家秀–買家秀”悖論。

☆成熟度模型的意義在于：用一把“應(yīng)用標(biāo)尺”，重建信任

飛書提出M1–M4四級(jí)成熟度模型，其實(shí)在做一件至關(guān)重要的事：把企業(yè)對(duì)AI的期望值校準(zhǔn)，把供應(yīng)商對(duì)交付能力的承諾標(biāo)準(zhǔn)化。

從“只講模型參數(shù)”到“講清產(chǎn)品可用性”，這本質(zhì)上是一次視角的轉(zhuǎn)變：

對(duì)企業(yè)用戶來說，成熟度模型讓他們可以設(shè)定合理預(yù)期，不再被“AI萬金油”式銷售術(shù)語蒙蔽；

對(duì)產(chǎn)品設(shè)計(jì)者來說，模型變成研發(fā)路線圖，知道什么是合格的交付標(biāo)準(zhǔn)；

對(duì)整個(gè)市場(chǎng)來說，這是一次從“無標(biāo)可循”走向“共識(shí)定義”的進(jìn)化。

飛書不是第一個(gè)嘗試分類模型的公司，但它的特別之處在于——這次不是實(shí)驗(yàn)室發(fā)布的技術(shù)論文，而是一家實(shí)際運(yùn)營(yíng)AI產(chǎn)品的公司，站在一線，把模型與產(chǎn)品逐一綁定、現(xiàn)場(chǎng)驗(yàn)證。

這讓這個(gè)模型的意義，不只是理論，更具有“工程實(shí)操價(jià)值”。

模型不是空談，

飛書用產(chǎn)品一一對(duì)標(biāo)成熟度等級(jí)

相比空泛的概念模型，飛書更具說服力的一點(diǎn)在于，它同步公布了多款A(yù)I產(chǎn)品，飛書不是停留在“講模型”，而是用產(chǎn)品去定義模型、驗(yàn)證模型。下面，我們來看幾個(gè)此次飛書發(fā)布的產(chǎn)品，并試圖將其與上面的AI應(yīng)用成熟度模型對(duì)應(yīng)起來。

☆M3標(biāo)準(zhǔn)：飛書知識(shí)問答——你的“企業(yè)豆包”

根據(jù)官方材料，飛書知識(shí)問答已達(dá)到M3級(jí)，即“成熟應(yīng)用、可以大規(guī)模使用”。

無需企業(yè)構(gòu)建知識(shí)庫，即可“開箱即用”；

能“穿透組織”，理解語境，提供基于企業(yè)內(nèi)部信息的準(zhǔn)確回答；

就像是一個(gè)理解公司全貌、能回答“企業(yè)問題”的“企業(yè)豆包”。

這意味著，知識(shí)問答具備跨部門、跨角色使用的穩(wěn)定性，是一個(gè)可廣泛部署的AI“助手型”產(chǎn)品。

☆M4標(biāo)準(zhǔn)：飛書會(huì)議——實(shí)時(shí)總結(jié)的成熟AI

飛書會(huì)議達(dá)到M4標(biāo)準(zhǔn)，屬于“完全成熟，在適合的任何場(chǎng)景都可使用”的產(chǎn)品。該產(chǎn)品支持會(huì)中實(shí)時(shí)總結(jié)，而非僅在會(huì)后回顧；能自動(dòng)生成紀(jì)要、輸出待辦事項(xiàng)，并通過文檔發(fā)送；準(zhǔn)確率與邏輯概括能力“相當(dāng)成熟”。

這表明飛書會(huì)議不僅能聽懂，還能“提煉”、“記錄”并“執(zhí)行”后續(xù)任務(wù)，是典型的高成熟度AI產(chǎn)品形態(tài)。

此外，飛書還發(fā)布或升級(jí)了多個(gè)具備AI能力的產(chǎn)品，也在逐步靠近M3及以上標(biāo)準(zhǔn)。

☆多維表格：功能躍遷中的“王牌產(chǎn)品”

雖然飛書未明確將“多維表格”歸入成熟度模型等級(jí)，但從其產(chǎn)品更新幅度來看，它正向M3級(jí)靠近：月活接近千萬，標(biāo)志其邁入成熟工具產(chǎn)品品類；支持“拖拉拽”搭建業(yè)務(wù)系統(tǒng)，兼顧美觀與實(shí)用；單表容量達(dá)1000萬熱行。

這使得多維表格不僅是表單工具，更開始具備“業(yè)務(wù)平臺(tái)”的潛質(zhì)，對(duì)小微企業(yè)與大型流程管理者都構(gòu)成實(shí)際可用價(jià)值。

此外，飛書還推出了AI開發(fā)套件，形成了更系統(tǒng)的企業(yè)AI能力框架。

?飛書妙搭（企業(yè)AI系統(tǒng)搭建工具）

該產(chǎn)品讓AI Coding快速落地產(chǎn)品思考，類比為“企業(yè)的無限產(chǎn)品經(jīng)理和初階開發(fā)人員”，可自動(dòng)輸出原型、生成系統(tǒng)。

?飛書Aily+aPaaS平臺(tái)

Aily為企業(yè)級(jí)Agent平臺(tái)，已在公牛集團(tuán)、美中愛瑞等公司落地；aPaaS平臺(tái)實(shí)現(xiàn)AI加持的PaaS化開發(fā)，強(qiáng)調(diào)“效率、穩(wěn)定、復(fù)用”的平衡

這些構(gòu)成了飛書在更深層次的AI基礎(chǔ)設(shè)施布局，雖然未在材料中明確打標(biāo)簽，但顯然是朝著高成熟度、高擴(kuò)展性方向演進(jìn)的產(chǎn)品組合。

AI的“L1-L5”時(shí)刻到了嗎？

飛書模型的行業(yè)意義與市場(chǎng)震動(dòng)

自動(dòng)駕駛行業(yè)早在數(shù)年前就確立了一套全行業(yè)通用的分級(jí)模型：L1到L5，定義了從人類輔助到完全無人駕駛的五個(gè)階段。這套模型并不僅僅是技術(shù)評(píng)估標(biāo)準(zhǔn)，它在根本上重新組織了整個(gè)產(chǎn)業(yè)鏈——幫助監(jiān)管者判斷風(fēng)險(xiǎn)、幫助企業(yè)評(píng)估能力邊界，也幫助公眾建立對(duì)“自動(dòng)化”的現(xiàn)實(shí)認(rèn)知。可以說，沒有L模型，就沒有今天自動(dòng)駕駛的理性競(jìng)爭(zhēng)格局。

而飛書此次提出的“M1–M4 AI應(yīng)用成熟度模型”，在本質(zhì)上正是對(duì)企業(yè)AI落地路徑的一次結(jié)構(gòu)化、工程化重構(gòu)。這不僅是一個(gè)模型發(fā)布，更可能是“企業(yè)級(jí)AI”真正走向成熟產(chǎn)業(yè)階段的標(biāo)志性事件。

☆模型之于產(chǎn)業(yè)，不是修辭，是基礎(chǔ)設(shè)施

飛書模型的提出，首先是一種對(duì)當(dāng)下AI產(chǎn)品泛濫但落地稀缺現(xiàn)象的清算。在過去一年中，企業(yè)面對(duì)AI時(shí)，往往只能依賴“演示效果”和“銷售口徑”來判斷其價(jià)值，而非清晰的標(biāo)準(zhǔn)。飛書此次以“M3=成熟可用、M4=全面通用”的方式，給出了明確的能力刻度。這種能力刻度，不是技術(shù)參數(shù)維度的“token長(zhǎng)度”或“訓(xùn)練數(shù)據(jù)規(guī)模”，而是以“可大規(guī)模部署”和“適配多場(chǎng)景”的可用性為核心，強(qiáng)調(diào)真實(shí)環(huán)境下的穩(wěn)定性、泛化能力與交付效果。

換句話說，它不問模型能不能生成“驚艷內(nèi)容”，而是問：這個(gè)AI功能在公司里能不能頂?shù)米?shí)際使用？能不能連續(xù)跑？出錯(cuò)率多高？

這正是To B場(chǎng)景下最需要的理性衡量方式。也正因如此，飛書模型與L模型之間產(chǎn)生了共振：它們都嘗試將“看不見的智能系統(tǒng)”拉入可以評(píng)估、可以管理、可以決策的框架之中，賦予市場(chǎng)真實(shí)的參考體系。

☆飛書想做的，是定義“可信AI”的使用上限

更深層次看，飛書通過這套模型的意圖并非只是幫助客戶選型，而是試圖建立企業(yè)AI應(yīng)用的行業(yè)標(biāo)準(zhǔn)語法。在一個(gè)尚無權(quán)威機(jī)構(gòu)給出通用評(píng)估體系的市場(chǎng)中，誰先給出一套被驗(yàn)證、被采用的結(jié)構(gòu)化標(biāo)準(zhǔn)，誰就擁有了定義未來的先手權(quán)。

從發(fā)布會(huì)披露的信息來看，飛書并不是“模型先行、產(chǎn)品隨后”，而是反其道而行之：用多個(gè)真實(shí)產(chǎn)品（知識(shí)問答、AI會(huì)議、多維表格等）作為標(biāo)準(zhǔn)“標(biāo)桿”，反向映射出這一模型的四級(jí)結(jié)構(gòu)。這種從底層產(chǎn)品能力抽象模型的路徑，比憑空建構(gòu)模型更有操作性，也更容易贏得行業(yè)信任。

它背后折射的是飛書團(tuán)隊(duì)對(duì)“工程視角AI”的理解——AI產(chǎn)品不是創(chuàng)意、不是賣相，而是一套能承載組織信任的生產(chǎn)工具。

☆企業(yè)級(jí)AI的下一階段，需要共識(shí)而非炫技

一個(gè)重要的判斷是：飛書這次的模型發(fā)布，將會(huì)引發(fā)AI工具廠商之間的“成熟度競(jìng)賽”。就像自動(dòng)駕駛廠商不能再用“我們很先進(jìn)”一筆帶過L幾級(jí)一樣，未來AI產(chǎn)品也將無法僅憑一句“用了大模型”就獲得企業(yè)青睞。客戶會(huì)開始反問：你們是M幾？在哪些場(chǎng)景部署了？準(zhǔn)確率多少？穩(wěn)定性如何？

這對(duì)市場(chǎng)生態(tài)是一種積極的“清場(chǎng)效應(yīng)”。它迫使廠商從“炫技”回到“交付”，從“拼參數(shù)”回到“拼耐用度”。

而這，正是一個(gè)行業(yè)走向真正成熟的開端。

你的AI，用到了第幾層？

AI正從“demo吸睛”走向“場(chǎng)景決勝”的階段。當(dāng)越來越多的企業(yè)開始意識(shí)到：AI真正的價(jià)值不是能生成一段漂亮的文本、畫一幅驚艷的圖，而是能否在流程中持續(xù)穩(wěn)定地產(chǎn)生價(jià)值時(shí)，我們其實(shí)已站在一個(gè)全新時(shí)代的門檻上。

飛書提出的“M1–M4 AI應(yīng)用成熟度模型”可能不是完美的答案，但它的出現(xiàn)，至少為長(zhǎng)期混沌不清的“企業(yè)AI落地標(biāo)準(zhǔn)”提供了一個(gè)結(jié)構(gòu)化的起點(diǎn)。

這個(gè)模型的意義，不止在于幫助飛書解釋自己的產(chǎn)品，也不僅僅是一次品牌自證，更像是一面行業(yè)鏡子——它讓企業(yè)有機(jī)會(huì)回過頭來問自己：

我們現(xiàn)在用的AI功能，真的是在解決問題，還是只是在展示技術(shù)？

我們花了大量預(yù)算接入AI，它在日常的流程中真正發(fā)揮了多少作用？

我們是否有評(píng)估一款A(yù)I系統(tǒng)“好不好用”的標(biāo)準(zhǔn)，而不是“新不新鮮”的情緒？

在AI從“先鋒試驗(yàn)”向“主流基礎(chǔ)設(shè)施”轉(zhuǎn)變的當(dāng)下，這些問題值得每一個(gè)企業(yè)決策者、產(chǎn)品經(jīng)理甚至一線員工思考。

如果你所在的企業(yè)，已經(jīng)部署了多種AI應(yīng)用，不妨回看一下你們的工具清單，用“M1–M4”的視角去做一場(chǎng)自測(cè)：哪些功能可以稱為成熟應(yīng)用？又有哪些，其實(shí)還停留在“演示”階段？

而如果你是一個(gè)在思考AI產(chǎn)品設(shè)計(jì)或采購路徑的從業(yè)者，不妨把飛書這次的模型作為一個(gè)“起點(diǎn)模板”——未必非要照搬，但至少，它給出了一個(gè)可以被溝通、可以被質(zhì)詢的語言系統(tǒng)。

企業(yè)AI的未來，屬于那些“最能穩(wěn)定服務(wù)流程、最能交付真實(shí)價(jià)值”的系統(tǒng)。飛書這次邁出的是定義標(biāo)準(zhǔn)的第一步，接下來要回答的問題，將是：誰能持續(xù)站在M3與M4之上？誰能用產(chǎn)品把成熟度走成護(hù)城河？

你的AI，現(xiàn)在用到了第幾層？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.