網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

美7000萬(wàn)人或被取代，Agent光速卷入職場(chǎng)！北大校友、楊笛一新作

2025-06-18 19:08:30　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：KingHZ

【新智元導(dǎo)讀】AI想替代誰(shuí)？誰(shuí)愿意被替代？北大校友的研究首次揭示數(shù)據(jù)真相！

1769年，瓦特改進(jìn)了蒸汽機(jī)。

1945年，計(jì)算機(jī)誕生。

2001年，3G移動(dòng)網(wǎng)絡(luò)開始部署。

這些發(fā)明創(chuàng)新徹底改變了人的生活：從農(nóng)田到工廠，從體力勞動(dòng)到腦力勞動(dòng)，從線下工作到線上工作。

2025年，AI智能體來(lái)了。這次是好是壞？

AI智能體將帶來(lái)規(guī)模最大的職場(chǎng)變革：僅在美國(guó)，就有多達(dá)7000萬(wàn)名工人即將面臨這場(chǎng)變革。

但幾乎從來(lái)沒(méi)有人關(guān)心他們真正的想法。

在AI加速自動(dòng)化各種工作的時(shí)代，斯坦福大學(xué)的研究團(tuán)隊(duì)選擇了另一種路徑：研究美國(guó)勞動(dòng)力中，工人們的意愿與 AI 能力之間的差距。

論文鏈接：https://arxiv.org/abs/2506.06576

博客鏈接：https://futureofwork.saltlab.stanford.edu/

這次，團(tuán)隊(duì)有3大研究發(fā)現(xiàn)：

職場(chǎng)AI智能體的需求-能力分布圖揭示了AI研究的關(guān)鍵錯(cuò)配現(xiàn)象：41.0%的Y Combinator企業(yè)任務(wù)集中在低優(yōu)先級(jí)區(qū)和自動(dòng)化「紅燈」區(qū)
眾多任務(wù)需要人機(jī)對(duì)等協(xié)作，但從業(yè)者普遍期望更高程度的人類主導(dǎo)權(quán)，這一矛盾可能引發(fā)摩擦
若AI智能體開始進(jìn)入勞動(dòng)力市場(chǎng)，人類核心能力或?qū)⑥D(zhuǎn)向人際交往與組織協(xié)調(diào)技能。

「AI真香定律」

這項(xiàng)研究對(duì)你很有用

這是跨學(xué)科研究團(tuán)隊(duì)：

計(jì)算機(jī)：Yijia Shao，Humishka Zope，Yucheng Jiang，楊笛一（Diyi Yang）

數(shù)字經(jīng)濟(jì)：David Nguyen, Erik Brynjolfsson

計(jì)算機(jī)+數(shù)字經(jīng)濟(jì)：Jiaxin Pei

團(tuán)隊(duì)建立了基于調(diào)查的嚴(yán)謹(jǐn)評(píng)估框架，用于摸清在全美各職業(yè)中，AI智能體實(shí)現(xiàn)「自動(dòng)化」和「增強(qiáng)人類能力」的潛力。

利用美國(guó)勞工部的數(shù)據(jù)庫(kù)，他們開展了以下工作：

調(diào)查了104個(gè)職業(yè)領(lǐng)域的1500名行業(yè)專家
招募了52名AI研究員和開發(fā)者來(lái)評(píng)估當(dāng)前AI智能體的能力

基于這些數(shù)據(jù)，研究人員構(gòu)建了「AI智能體從業(yè)者前景與準(zhǔn)備度知識(shí)庫(kù)」（Worker Outlook & Readiness Knowledge Bank，WORKBank）。

如果不從事AI相關(guān)工作，為什么你也應(yīng)該關(guān)心這件事？

因?yàn)锳I的「真香定律」：「你可能對(duì)AI不感興趣，但AI終將對(duì)你產(chǎn)生興趣。」

為了指導(dǎo)未來(lái)AI智能體的研發(fā)，并幫助研究人員人類為未來(lái)的工作做好準(zhǔn)備，團(tuán)隊(duì)正式發(fā)布了WORKBank數(shù)據(jù)庫(kù)的第一個(gè)版本。

AI來(lái)襲，

職場(chǎng)海嘯？

AI正在職場(chǎng)引發(fā)革命！

2023年，OpenAI等機(jī)構(gòu)的研究表明，約80%的美國(guó)勞動(dòng)者可能面臨大語(yǔ)言模型（LLM）影響其至少10%的工作任務(wù)，其中19%的勞動(dòng)者超過(guò)半數(shù)職責(zé)或?qū)⑹艿經(jīng)_擊。

論文鏈接：https://arxiv.org/abs/2303.10130

2025年初，Anthropic分析了LLM使用數(shù)據(jù)，結(jié)論進(jìn)一步顯示：

在36%的職業(yè)中，AI工具已活躍應(yīng)用于至少25%的工作任務(wù)。

論文鏈接：https://arxiv.org/abs/2503.04761

對(duì)普通打工人而言，AI到底是福是禍？

這一次AI專家攜手經(jīng)濟(jì)學(xué)家，直接從一線從業(yè)者反饋獲取洞見。

他們提出了雙視角的審計(jì)框架：

一是工人希望AI承擔(dān)哪些任務(wù)，

二是專家評(píng)估AI實(shí)際上能勝任哪些任務(wù)。

為了幫助參與者準(zhǔn)確表達(dá)想法，問(wèn)卷設(shè)計(jì)了有邏輯引導(dǎo)的問(wèn)題，并加入音頻訪談，方便他們結(jié)合實(shí)際工作經(jīng)驗(yàn)回答。

基于這個(gè)框架，研究團(tuán)隊(duì)構(gòu)建了WORKBank數(shù)據(jù)庫(kù)，用數(shù)據(jù)全面描繪需求和影響：

·工人的實(shí)際需求

·任務(wù)能否被AI接手的圖譜（意愿—能力分布）

·不同任務(wù)對(duì)人類參與程度的要求（HAS等級(jí)）

·這些變化可能對(duì)人類核心技能產(chǎn)生的影響

圖1：審計(jì)框架概覽與關(guān)鍵發(fā)現(xiàn)

打工人的欲望與恐懼

為何不愿讓AI智能體介入工作？

利用AI對(duì)工人語(yǔ)音回答進(jìn)行歸類，研究人員總結(jié)了AI自動(dòng)化最常見的三大擔(dān)憂：

45%表示：不信任AI系統(tǒng)的準(zhǔn)確性、能力或可靠性；
23%擔(dān)心：AI會(huì)取代自己的工作；
16.3%認(rèn)為：AI缺乏「人味」，無(wú)法做到人類那種溝通、理解與判斷。

從行業(yè)來(lái)看，藝術(shù)、設(shè)計(jì)與媒體領(lǐng)域的抵觸情緒最明顯——

在這些領(lǐng)域里，只有17.1%的任務(wù)得到了工人的正面自動(dòng)化評(píng)價(jià)。這說(shuō)明，在更依賴創(chuàng)造力與情感表達(dá)的工作中，工人對(duì)AI的接受度更低。

哪些任務(wù)愿意讓AI來(lái)做？

研究團(tuán)隊(duì)發(fā)現(xiàn)，在約46.1%的任務(wù)中，正在從事這些工作的工人表示「愿意讓AI來(lái)做」。

即便是在被提醒要考慮「失業(yè)風(fēng)險(xiǎn)」或「工作變得無(wú)聊」之后，他們依然在問(wèn)卷中打了超過(guò)3分（滿分5分）的支持評(píng)分，說(shuō)明這些任務(wù)更容易被接受自動(dòng)化。

自動(dòng)化意愿評(píng)分在任務(wù)中的分布。縱軸為工人對(duì)任務(wù)自動(dòng)化的意愿評(píng)分（1到5分），橫軸為844項(xiàng)任務(wù)的排名

上圖顯示，有46.1%的任務(wù)評(píng)分高于3分，表示工人對(duì)這些任務(wù)由AI自動(dòng)完成持積極態(tài)度。

排名前3的任務(wù)包括：

報(bào)稅員：安排客戶預(yù)約（5.00分）
公共安全通信員：維護(hù)緊急呼叫相關(guān)信息檔案（4.67分）
考勤文員：記錄并調(diào)整因錯(cuò)誤造成的工資問(wèn)題（4.60分）

評(píng)分最低的3個(gè)任務(wù)則是：

編輯：撰寫文章、社論或通訊稿（1.60分）
物流分析師：聯(lián)系供應(yīng)商了解物料情況（1.50分）
售票與旅行服務(wù)員：追蹤客戶行李丟失或延誤情況（1.50分）

為什么工人希望讓AI來(lái)接手工作？

研究團(tuán)隊(duì)調(diào)查了支持自動(dòng)化的工人為什么愿意讓AI來(lái)幫忙——通過(guò)多選題和自由回答兩種方式。

最常見的理由是：「可以把時(shí)間騰出來(lái)，去做更有價(jià)值的工作」，這項(xiàng)理由被69%的人選中。

其他常見原因包括：任務(wù)太重復(fù)（47%）、太累太有壓力（26%）、或者希望通過(guò)AI提升工作質(zhì)量（47%）。

從工人和專家的評(píng)分對(duì)比中，研究人員把任務(wù)大致分成了四個(gè)區(qū)域：

綠燈區(qū)：工人想交給AI，AI技術(shù)也能勝任。是最理想的自動(dòng)化對(duì)象，有望帶來(lái)效率與社會(huì)效益雙贏。
紅燈區(qū)：AI技術(shù)沒(méi)問(wèn)題，但工人不愿意。這類任務(wù)部署AI要小心，容易引發(fā)抵觸或更大爭(zhēng)議。
研發(fā)機(jī)會(huì)區(qū)：工人很希望AI來(lái)做，但現(xiàn)在AI還做不到。是未來(lái)技術(shù)突破的重點(diǎn)方向。
低優(yōu)先級(jí)區(qū)：工人不想交給AI，AI也還做不到。暫時(shí)不是AI發(fā)展的重點(diǎn)。

意愿—能力圖譜

這張「意愿—能力圖譜」幫助識(shí)別出哪些任務(wù)值得重點(diǎn)投入。

但當(dāng)把YC旗下的創(chuàng)業(yè)公司與這些任務(wù)匹配時(shí)，研究人員發(fā)現(xiàn)：目前的投資并未優(yōu)先關(guān)注「綠燈區(qū)」或「研發(fā)機(jī)會(huì)區(qū)」。反而有約41%的YC公司集中在「紅燈區(qū)」或「低優(yōu)先級(jí)區(qū)」這些不太受歡迎或技術(shù)難度高的任務(wù)。

換句話說(shuō)，許多「技術(shù)可行+工人也歡迎」的任務(wù)，其實(shí)并沒(méi)有得到應(yīng)有的重視。

這提醒我們：AI的發(fā)展不僅要看技術(shù)本身，也要看人們真正想要什么。

人機(jī)協(xié)作

不只替代，AI更是搭檔

AI智能體對(duì)工作的影響并非簡(jiǎn)單的「自動(dòng)化」或「非自動(dòng)化」這樣的二選一問(wèn)題。

為此，研究人員引入了「人類能動(dòng)性等級(jí)」（Human Agency Scale）：包含 5 個(gè)等級(jí)的量表，涵蓋了從「完全自動(dòng)化」到「人機(jī)協(xié)作增益」之間的各種狀態(tài)——

在后一種狀態(tài)下，技術(shù)主要用于補(bǔ)充和增強(qiáng)人類的能力。

H1：AI能完全獨(dú)立完成任務(wù)，無(wú)需人參與。

H2：AI能完成大部分任務(wù)，偶爾需要人類輸入。

H3：AI和人類平等協(xié)作，效果優(yōu)于任何一方單獨(dú)完成。

H4：AI必須依賴人類才能完成任務(wù)。

H5：AI無(wú)法獨(dú)立完成任務(wù)，必須全程由人主導(dǎo)。

這一等級(jí)體系不是說(shuō)「越高越好」，而是用來(lái)匹配不同任務(wù)的實(shí)際需求。

下圖2展示了這五個(gè)等級(jí)在不同任務(wù)中的具體例子，比如哪些任務(wù)適合完全交給 AI，哪些則需要人機(jī)長(zhǎng)期協(xié)作。

HAS不僅能讓人更清楚地理解「AI適合做什么」，也為打工人準(zhǔn)備未來(lái)技能、開發(fā)者設(shè)計(jì)更合理的AI智能體提供了清晰的參考。

總體上，工人更傾向于較高水平的人類參與，這可能預(yù)示著隨著AI能力增強(qiáng)，會(huì)產(chǎn)生一定的摩擦。

在調(diào)查的104種職業(yè)中，有47種工人最傾向的等級(jí)是H3——也就是「人機(jī)平等協(xié)作」。

這說(shuō)明，很多工人并不想讓AI全面接管工作，而是希望AI成為有力的合作伙伴。

不過(guò)，也出現(xiàn)了值得注意的現(xiàn)象：在將近一半（47.5%）的任務(wù)中，工人希望的「人類參與度」遠(yuǎn)超專家估計(jì)。

更極端的是，有16.4%的任務(wù)，工人希望的等級(jí)高出專家評(píng)估兩個(gè)檔次。這意味著，哪怕AI已經(jīng)技術(shù)上「能做」，很多工人還是不放心、不愿放手。

人類能動(dòng)性程度在同一職業(yè)內(nèi)部也存在差異，有些任務(wù)適合自動(dòng)化，有些則不然。

這也提醒開發(fā)者：在設(shè)計(jì)AI智能體時(shí)，不能一刀切。

為未來(lái)做好準(zhǔn)備

并不是所有類型的工作都會(huì)同樣受到AI的影響。

為了理解未來(lái)工作的走向，以及哪些技能將變得最有價(jià)值，研究團(tuán)隊(duì)進(jìn)一步利用 WORKBank數(shù)據(jù)庫(kù)來(lái)分析人類技能的變化趨勢(shì)。

最后發(fā)現(xiàn)了三項(xiàng)可能影響未來(lái)人類工作的趨勢(shì)：

對(duì)信息處理類技能的需求正在減弱。它們?cè)谀切┤祟悈⑴c度高的任務(wù)中出現(xiàn)較少。
人際溝通與組織管理類技能正變得更重要。它們?cè)诟逪AS等級(jí)的任務(wù)中更為常見。
高人類參與度的技能涵蓋多種維度。平均人類參與度最高的前十項(xiàng)技能，跨越了人際、組織、決策與判斷等多個(gè)方面。

作者介紹

Yijia Shao是斯坦福大學(xué)的博士生，師從楊笛一教授。

此前，她在北京大學(xué)元培學(xué)院獲得學(xué)士學(xué)位。

她曾在微軟亞洲研究院、谷歌Tensorflow Lite團(tuán)隊(duì)實(shí)習(xí)。

她的研究方向?yàn)闄C(jī)器學(xué)習(xí)與自然語(yǔ)言處理。

參考資料：

https://x.com/EchoShao8899/status/1933178209484603725

https://arxiv.org/abs/2506.06576

https://www.linkedin.com/feed/update/urn:li:activity:7338949272769282053/

https://futureofwork.saltlab.stanford.edu/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.