新智元報(bào)道
編輯:KingHZ
【新智元導(dǎo)讀】AI想替代誰(shuí)?誰(shuí)愿意被替代?北大校友的研究首次揭示數(shù)據(jù)真相!
1769年,瓦特改進(jìn)了蒸汽機(jī)。
1945年,計(jì)算機(jī)誕生。
2001年,3G移動(dòng)網(wǎng)絡(luò)開始部署。
這些發(fā)明創(chuàng)新徹底改變了人的生活:從農(nóng)田到工廠,從體力勞動(dòng)到腦力勞動(dòng),從線下工作到線上工作。
2025年,AI智能體來(lái)了。這次是好是壞?
AI智能體將帶來(lái)規(guī)模最大的職場(chǎng)變革:僅在美國(guó),就有多達(dá)7000萬(wàn)名工人即將面臨這場(chǎng)變革。
但幾乎從來(lái)沒(méi)有人關(guān)心他們真正的想法。
在AI加速自動(dòng)化各種工作的時(shí)代,斯坦福大學(xué)的研究團(tuán)隊(duì)選擇了另一種路徑:研究美國(guó)勞動(dòng)力中,工人們的意愿與 AI 能力之間的差距。
論文鏈接:https://arxiv.org/abs/2506.06576
博客鏈接:https://futureofwork.saltlab.stanford.edu/
這次,團(tuán)隊(duì)有3大研究發(fā)現(xiàn):
職場(chǎng)AI智能體的需求-能力分布圖揭示了AI研究的關(guān)鍵錯(cuò)配現(xiàn)象:41.0%的Y Combinator企業(yè)任務(wù)集中在低優(yōu)先級(jí)區(qū)和自動(dòng)化「紅燈」區(qū)
眾多任務(wù)需要人機(jī)對(duì)等協(xié)作,但從業(yè)者普遍期望更高程度的人類主導(dǎo)權(quán),這一矛盾可能引發(fā)摩擦
若AI智能體開始進(jìn)入勞動(dòng)力市場(chǎng),人類核心能力或?qū)⑥D(zhuǎn)向人際交往與組織協(xié)調(diào)技能。
「AI真香定律」
這項(xiàng)研究對(duì)你很有用
這是跨學(xué)科研究團(tuán)隊(duì):
計(jì)算機(jī):Yijia Shao,Humishka Zope,Yucheng Jiang,楊笛一(Diyi Yang)
數(shù)字經(jīng)濟(jì):David Nguyen, Erik Brynjolfsson
計(jì)算機(jī)+數(shù)字經(jīng)濟(jì):Jiaxin Pei
團(tuán)隊(duì)建立了基于調(diào)查的嚴(yán)謹(jǐn)評(píng)估框架,用于摸清在全美各職業(yè)中,AI智能體實(shí)現(xiàn)「自動(dòng)化」和「增強(qiáng)人類能力」的潛力。
利用美國(guó)勞工部的數(shù)據(jù)庫(kù),他們開展了以下工作:
調(diào)查了104個(gè)職業(yè)領(lǐng)域的1500名行業(yè)專家
招募了52名AI研究員和開發(fā)者來(lái)評(píng)估當(dāng)前AI智能體的能力
基于這些數(shù)據(jù),研究人員構(gòu)建了「AI智能體從業(yè)者前景與準(zhǔn)備度知識(shí)庫(kù)」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不從事AI相關(guān)工作,為什么你也應(yīng)該關(guān)心這件事?
因?yàn)锳I的「真香定律」:「你可能對(duì)AI不感興趣,但AI終將對(duì)你產(chǎn)生興趣。」
為了指導(dǎo)未來(lái)AI智能體的研發(fā),并幫助研究人員人類為未來(lái)的工作做好準(zhǔn)備,團(tuán)隊(duì)正式發(fā)布了WORKBank數(shù)據(jù)庫(kù)的第一個(gè)版本。
AI來(lái)襲,
職場(chǎng)海嘯?
AI正在職場(chǎng)引發(fā)革命!
2023年,OpenAI等機(jī)構(gòu)的研究表明,約80%的美國(guó)勞動(dòng)者可能面臨大語(yǔ)言模型(LLM)影響其至少10%的工作任務(wù),其中19%的勞動(dòng)者超過(guò)半數(shù)職責(zé)或?qū)⑹艿經(jīng)_擊。
論文鏈接:https://arxiv.org/abs/2303.10130
2025年初,Anthropic分析了LLM使用數(shù)據(jù),結(jié)論進(jìn)一步顯示:
在36%的職業(yè)中,AI工具已活躍應(yīng)用于至少25%的工作任務(wù)。
論文鏈接:https://arxiv.org/abs/2503.04761
對(duì)普通打工人而言,AI到底是福是禍?
這一次AI專家攜手經(jīng)濟(jì)學(xué)家,直接從一線從業(yè)者反饋獲取洞見。
他們提出了雙視角的審計(jì)框架:
一是工人希望AI承擔(dān)哪些任務(wù),
二是專家評(píng)估AI實(shí)際上能勝任哪些任務(wù)。
為了幫助參與者準(zhǔn)確表達(dá)想法,問(wèn)卷設(shè)計(jì)了有邏輯引導(dǎo)的問(wèn)題,并加入音頻訪談,方便他們結(jié)合實(shí)際工作經(jīng)驗(yàn)回答。
基于這個(gè)框架,研究團(tuán)隊(duì)構(gòu)建了WORKBank數(shù)據(jù)庫(kù),用數(shù)據(jù)全面描繪需求和影響:
·工人的實(shí)際需求
·任務(wù)能否被AI接手的圖譜(意愿—能力分布)
·不同任務(wù)對(duì)人類參與程度的要求(HAS等級(jí))
·這些變化可能對(duì)人類核心技能產(chǎn)生的影響
圖1:審計(jì)框架概覽與關(guān)鍵發(fā)現(xiàn)
打工人的欲望與恐懼
為何不愿讓AI智能體介入工作?
利用AI對(duì)工人語(yǔ)音回答進(jìn)行歸類,研究人員總結(jié)了AI自動(dòng)化最常見的三大擔(dān)憂:
45%表示:不信任AI系統(tǒng)的準(zhǔn)確性、能力或可靠性;
23%擔(dān)心:AI會(huì)取代自己的工作;
16.3%認(rèn)為:AI缺乏「人味」,無(wú)法做到人類那種溝通、理解與判斷。
從行業(yè)來(lái)看,藝術(shù)、設(shè)計(jì)與媒體領(lǐng)域的抵觸情緒最明顯——
在這些領(lǐng)域里,只有17.1%的任務(wù)得到了工人的正面自動(dòng)化評(píng)價(jià)。這說(shuō)明,在更依賴創(chuàng)造力與情感表達(dá)的工作中,工人對(duì)AI的接受度更低。
哪些任務(wù)愿意讓AI來(lái)做?
研究團(tuán)隊(duì)發(fā)現(xiàn),在約46.1%的任務(wù)中,正在從事這些工作的工人表示「愿意讓AI來(lái)做」。
即便是在被提醒要考慮「失業(yè)風(fēng)險(xiǎn)」或「工作變得無(wú)聊」之后,他們依然在問(wèn)卷中打了超過(guò)3分(滿分5分)的支持評(píng)分,說(shuō)明這些任務(wù)更容易被接受自動(dòng)化。
自動(dòng)化意愿評(píng)分在任務(wù)中的分布。縱軸為工人對(duì)任務(wù)自動(dòng)化的意愿評(píng)分(1到5分),橫軸為844項(xiàng)任務(wù)的排名
上圖顯示,有46.1%的任務(wù)評(píng)分高于3分,表示工人對(duì)這些任務(wù)由AI自動(dòng)完成持積極態(tài)度。
排名前3的任務(wù)包括:
報(bào)稅員:安排客戶預(yù)約(5.00分)
公共安全通信員:維護(hù)緊急呼叫相關(guān)信息檔案(4.67分)
考勤文員:記錄并調(diào)整因錯(cuò)誤造成的工資問(wèn)題(4.60分)
評(píng)分最低的3個(gè)任務(wù)則是:
編輯:撰寫文章、社論或通訊稿(1.60分)
物流分析師:聯(lián)系供應(yīng)商了解物料情況(1.50分)
售票與旅行服務(wù)員:追蹤客戶行李丟失或延誤情況(1.50分)
研究團(tuán)隊(duì)調(diào)查了支持自動(dòng)化的工人為什么愿意讓AI來(lái)幫忙——通過(guò)多選題和自由回答兩種方式。
最常見的理由是:「可以把時(shí)間騰出來(lái),去做更有價(jià)值的工作」,這項(xiàng)理由被69%的人選中。
其他常見原因包括:任務(wù)太重復(fù)(47%)、太累太有壓力(26%)、或者希望通過(guò)AI提升工作質(zhì)量(47%)。
從工人和專家的評(píng)分對(duì)比中,研究人員把任務(wù)大致分成了四個(gè)區(qū)域:
綠燈區(qū):工人想交給AI,AI技術(shù)也能勝任。是最理想的自動(dòng)化對(duì)象,有望帶來(lái)效率與社會(huì)效益雙贏。
紅燈區(qū):AI技術(shù)沒(méi)問(wèn)題,但工人不愿意。這類任務(wù)部署AI要小心,容易引發(fā)抵觸或更大爭(zhēng)議。
研發(fā)機(jī)會(huì)區(qū):工人很希望AI來(lái)做,但現(xiàn)在AI還做不到。是未來(lái)技術(shù)突破的重點(diǎn)方向。
低優(yōu)先級(jí)區(qū):工人不想交給AI,AI也還做不到。暫時(shí)不是AI發(fā)展的重點(diǎn)。
意愿—能力圖譜
這張「意愿—能力圖譜」幫助識(shí)別出哪些任務(wù)值得重點(diǎn)投入。
但當(dāng)把YC旗下的創(chuàng)業(yè)公司與這些任務(wù)匹配時(shí),研究人員發(fā)現(xiàn):目前的投資并未優(yōu)先關(guān)注「綠燈區(qū)」或「研發(fā)機(jī)會(huì)區(qū)」。反而有約41%的YC公司集中在「紅燈區(qū)」或「低優(yōu)先級(jí)區(qū)」這些不太受歡迎或技術(shù)難度高的任務(wù)。
換句話說(shuō),許多「技術(shù)可行+工人也歡迎」的任務(wù),其實(shí)并沒(méi)有得到應(yīng)有的重視。
這提醒我們:AI的發(fā)展不僅要看技術(shù)本身,也要看人們真正想要什么。
人機(jī)協(xié)作
不只替代,AI更是搭檔
AI智能體對(duì)工作的影響并非簡(jiǎn)單的「自動(dòng)化」或「非自動(dòng)化」這樣的二選一問(wèn)題。
為此,研究人員引入了「人類能動(dòng)性等級(jí)」(Human Agency Scale):包含 5 個(gè)等級(jí)的量表,涵蓋了從「完全自動(dòng)化」到「人機(jī)協(xié)作增益」之間的各種狀態(tài)——
在后一種狀態(tài)下,技術(shù)主要用于補(bǔ)充和增強(qiáng)人類的能力。
H1:AI能完全獨(dú)立完成任務(wù),無(wú)需人參與。
H2:AI能完成大部分任務(wù),偶爾需要人類輸入。
H3:AI和人類平等協(xié)作,效果優(yōu)于任何一方單獨(dú)完成。
H4:AI必須依賴人類才能完成任務(wù)。
H5:AI無(wú)法獨(dú)立完成任務(wù),必須全程由人主導(dǎo)。
這一等級(jí)體系不是說(shuō)「越高越好」,而是用來(lái)匹配不同任務(wù)的實(shí)際需求。
下圖2展示了這五個(gè)等級(jí)在不同任務(wù)中的具體例子,比如哪些任務(wù)適合完全交給 AI,哪些則需要人機(jī)長(zhǎng)期協(xié)作。
HAS不僅能讓人更清楚地理解「AI適合做什么」,也為打工人準(zhǔn)備未來(lái)技能、開發(fā)者設(shè)計(jì)更合理的AI智能體提供了清晰的參考。
總體上,工人更傾向于較高水平的人類參與,這可能預(yù)示著隨著AI能力增強(qiáng),會(huì)產(chǎn)生一定的摩擦。
在調(diào)查的104種職業(yè)中,有47種工人最傾向的等級(jí)是H3——也就是「人機(jī)平等協(xié)作」。
這說(shuō)明,很多工人并不想讓AI全面接管工作,而是希望AI成為有力的合作伙伴。
不過(guò),也出現(xiàn)了值得注意的現(xiàn)象:在將近一半(47.5%)的任務(wù)中,工人希望的「人類參與度」遠(yuǎn)超專家估計(jì)。
更極端的是,有16.4%的任務(wù),工人希望的等級(jí)高出專家評(píng)估兩個(gè)檔次。這意味著,哪怕AI已經(jīng)技術(shù)上「能做」,很多工人還是不放心、不愿放手。
人類能動(dòng)性程度在同一職業(yè)內(nèi)部也存在差異,有些任務(wù)適合自動(dòng)化,有些則不然。
這也提醒開發(fā)者:在設(shè)計(jì)AI智能體時(shí),不能一刀切。
為未來(lái)做好準(zhǔn)備
并不是所有類型的工作都會(huì)同樣受到AI的影響。
為了理解未來(lái)工作的走向,以及哪些技能將變得最有價(jià)值,研究團(tuán)隊(duì)進(jìn)一步利用 WORKBank數(shù)據(jù)庫(kù)來(lái)分析人類技能的變化趨勢(shì)。
最后發(fā)現(xiàn)了三項(xiàng)可能影響未來(lái)人類工作的趨勢(shì):
對(duì)信息處理類技能的需求正在減弱。它們?cè)谀切┤祟悈⑴c度高的任務(wù)中出現(xiàn)較少。
人際溝通與組織管理類技能正變得更重要。它們?cè)诟逪AS等級(jí)的任務(wù)中更為常見。
高人類參與度的技能涵蓋多種維度。平均人類參與度最高的前十項(xiàng)技能,跨越了人際、組織、決策與判斷等多個(gè)方面。
作者介紹
Yijia Shao是斯坦福大學(xué)的博士生,師從楊笛一教授。
此前,她在北京大學(xué)元培學(xué)院獲得學(xué)士學(xué)位。
她曾在微軟亞洲研究院、谷歌Tensorflow Lite團(tuán)隊(duì)實(shí)習(xí)。
她的研究方向?yàn)闄C(jī)器學(xué)習(xí)與自然語(yǔ)言處理。
參考資料:
https://x.com/EchoShao8899/status/1933178209484603725
https://arxiv.org/abs/2506.06576
https://www.linkedin.com/feed/update/urn:li:activity:7338949272769282053/
https://futureofwork.saltlab.stanford.edu/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.