人們到底想要什么樣的AI?
來源 |騰訊科技
作者 |郝博陽
2025年1月到5月間,斯坦福大學的研究團隊完成了一項本應在AI熱潮開始時就進行的調查。
他們采訪了1500名美國員工和52名AI專家,評估了104個職業中的844項具體任務。
這項由經濟學家Erik Brynjolfsson和Yijia Shao領導的研究,第一次系統地量化了一個簡單卻被忽視的問題:
人們到底想要什么樣的AI?
在這844項職業任務中,研究者讓員工們用1到5分評價他們對AI自動化的渴望程度。
結果呈現出一幅復雜的圖景:
僅有7.11%的任務得分大于等于4分,意味著員工希望大部分由AI來接管;
另有6.16%的任務得分在2分以下,表明員工強烈抵觸自動化。
總體而言,46.1%的任務獲得了3分以上的正面評價,但這個看似中性的數字掩蓋了巨大的行業差異。
在計算機和數學領域,超過半數的任務受到歡迎;
而在藝術、設計和媒體領域,這個比例驟降至17.1%。
更關鍵的發現在于,當研究者將這些員工需求數據與硅谷的實際投資流向對比時,一個令人不安的錯配模式浮現了出來。
01
需求與供給的斷層
“需求-能力”矩陣
研究團隊創造性地構建了一個“需求-能力“矩陣,基于員工的自動化意愿(Aw(t))和AI專家評估的技術可行性(Ae(t)),將所有844項任務劃分為四個象限。
“自動化綠燈區“代表那些員工想要且技術可行的任務;
“紅燈區“則是技術可行但員工抵觸的領域;
“研發機會區“包含員工渴望但技術尚未成熟的任務;
“低優先區“則是既無需求也無能力的任務。
通過將Y Combinator孵化的,723家AI相關公司映射到這些任務上,研究揭示了一個驚人的事實:
41.0%的公司-任務映射落在了“低優先區“和“紅燈區“。
換言之,近一半的AI創業努力都投向了員工既不需要也不想要的方向。
具體數據更能說明問題。
在“綠燈區“,平均每個任務對應117.63家YC公司;
“研發機會區“是134.57家;
而“低優先區“和“紅燈區“分別是118.87家和134.35家。
這種近乎均勻的分布表明,投資決策與實際需求之間幾乎不存在相關性。
以稅務準備為例。“安排客戶會見“這項任務獲得了員工給出的滿分5.0分,意味著所有受訪稅務準備人員都迫切希望AI能接管這項工作。
技術上,這是一個相對簡單的日程管理問題。
然而,專注于此類“綠燈區“任務的創業公司寥寥無幾。
相反,客戶服務聊天機器人——
一個超過40%員工明確表示不需要的“紅燈區”卻吸引了大量投資。
研究團隊獲得了Anthropic提供的Claude.ai使用數據,涵蓋2024年12月至2025年1月的使用情況。
對比分析揭示了另一層錯配:
員工自動化需求最高的前10個職業(包括稅務準備員、公共安全調度員、計時員等)僅占Claude.ai總使用量的1.26%。
這個數字的含義是雙重的。
一方面,它表明當前的AI工具可能沒有觸及真正需要幫助的人群;
另一方面,它也暗示著巨大的未開發市場。
那些每天忙于安排會見、維護文件、處理工資調整的員工們,可能根本不知道AI能夠幫助他們,或者現有的AI工具并不適合他們的具體需求。
這就是典型的資源錯配。
更有趣的是,學術研究顯示出了與產業界不同的關注點。
通過分析截至2025年4月24日arXiv上的17,064篇相關論文,研究團隊篩選出1,222篇真正涉及AI智能體系統的論文。
這些論文在四個任務區域的分布顯示,學術界更多地關注“研發機會區“——
那些員工需要但技術尚未成熟的領域。
這方面,他們比產業界反而嗅覺靈敏,但也太過追求前沿。
然而,即使是學術研究也存在嚴重的領域集中問題。
獲得最多論文覆蓋的三項任務全部屬于“計算機和信息研究科學家“職業:
應用理論專業知識和創新來創造或應用新技術(1,169篇)、分析問題以開發涉及計算機硬件和軟件的解決方案(1,132篇)、執行或指導現有程序的修訂、修復或擴展(1,109篇)。
就算是科學家,也更關心自己家的事情。
02
在工作替代這件事上專家意見不一定能代表從業者
人類參與度量表
斯坦福團隊的一個重要貢獻是引入了“人類參與度量表“(Human Agency Scale, HAS)。
這個從H1到H5的五級量表,量化了從“AI完全自主“到“人類完全主導“的不同協作模式。
HAS的分布揭示了不同職業中人工智能體整合的多樣化格局
數據顯示,在104個被研究的職業中,有47個(45.2%)將H3級——“人機平等伙伴關系”作為最受歡迎的模式。
只有2個職業(1.9%)偏好H1級的完全自動化,1個職業(1.0%)堅持H5級的人類完全主導。
35.6%的職業傾向于H2級(AI主導但需要關鍵人類輸入),16.3%選擇H4級(人類主導但AI輔助)。
更引人深思的是員工期望與專家評估之間的系統性偏差。
在844項任務中,僅有26.9%在兩個群體間獲得了相同的HAS評級。
在剩余的任務中,47.5%顯示員工期望的人類參與度高于專家認為技術所需的水平,25.6%則相反。
通過計算兩個分布之間的距離,研究識別出員工的意見和專家意見分歧最大的職業。
電力調度員以0.830的JSD值位居榜首,其次是醫療轉錄員(0.675)和證券銷售代理(0.615)。
這些職業的共同特點是,AI專家認為許多任務已可實現H1級自動化,但從業者堅持需要更高的人類參與。
這再次顯示出了具體領域中的某些復雜細節可能與專家評估的簡單流程化操作完全不同。
按照專家的思路走,這些AI初創公司很可能會掉進復雜細節,難以統一化的泥潭。
藝術、設計和媒體領域算是從業者抵抗AI入侵的最前沿了。
在該領域的所有任務中,只有17.1%獲得了超過3分的自動化意愿評分。
具體來看,“編輯:撰寫故事、文章、社論或通訊”的平均得分僅為1.60分;
“平面設計師:基于布局原則和美學設計概念創建設計、概念和樣本布局”得分1.78;
“制片人和導演:剪輯電影或錄像帶”得分1.75。
他們也有足夠的理由。
通過分析1500份音頻訪談記錄,研究團隊使用LLM輔助的主題建模技術提取了員工們的核心關切。
在被問及“你如何設想在日常工作中使用AI”時,28.0%的受訪者表達了某種形式的擔憂或負面情緒。
這些擔憂可以歸納為三大類:
45.0%的人不信任AI系統的準確性、能力或可靠性;
23.0%擔心工作被取代;
16.3%認為AI缺乏人類特質或能力。
一位擁有6-10年經驗的藝術總監的表述頗具代表性:
“我想要它用于無縫地優化工作流程,讓事情變得不那么重復、乏味和艱苦。不要內容創作。”
另一位3-5年經驗的藝術總監說得更直接:“我絕不會用AI來取代藝術家。”
但好萊塢可能有別的想法,最后市場會驗證到底哪邊更對。
03
數據背后的深層邏輯
基于薪資均值與人類自主性需求的技能排行對比
研究通過統計分析揭示了一些深層模式。
員工的自動化需求(Aw(t))與其對失業的擔憂呈顯著負相關,與工作享受度的相關性更強。
這意味著員工們想要自動化的,恰恰是那些他們不享受且不太擔心會因此失業的任務。
更深入的分析顯示,擁有博士學位的員工比本科學歷者對自動化的需求高0.236分;
工作經驗超過10年的人比1-2年經驗者的需求高22.9%;
強烈同意“AI能減輕繁瑣工作“的人比中立者的自動化需求高0.685分。
這既顯示出了人們對AI的訴求,即利用它們去除繁瑣的工作,專注更多有價值的高級事物。
也在另一方面顯示出,教育、經驗對于AI時代的工作者而言可能更為重要——
他們能更好的確認什么是重復、缺乏創新的部分,去發揮AI更大的作用。
那去除掉繁瑣工作之后,人們工作和技能發展的中心可能會轉移到哪里去呢?
研究通過將任務映射到O*NET數據庫定義的27項通用工作活動,研究揭示了AI可能如何重塑職場技能的價值體系。
研究者計算了每項技能相關任務的平均工資(基于美國勞工統計局2024年5月數據)和平均所需人類參與度。
結果顯示了一種深刻的價值倒置。
“分析數據或信息”——目前平均工資最高的技能——在需要高人類參與度的任務中排名僅第17位。
相反,一些傳統上被低估的技能正在崛起:
“培訓和教授他人”從工資排名第21位躍升至參與度需求第2位;
“組織、規劃和優先安排工作”從第11位升至第1位;
“協助和照顧他人”從第26位升至第14位。
在AI時代,最有價值的人類技能可能不再是處理信息,而是處理人際關系、傳授知識、組織協調——
那些本質上需要人類判斷、同理心和創造性的工作。
04
AI產業革命不能靠拍腦門兒想出來的需求
斯坦福的這項研究不僅僅是一份學術報告,它更像是給硅谷的一份診斷書。
當41%的AI創業公司在解決沒人想要解決的問題時,當最需要幫助的員工只占AI工具使用量的1.26%時,當投資分布與實際需求幾乎毫無相關時,我們不得不問:這場AI革命究竟是為誰而進行的?
WORKBank數據庫的建立為持續追蹤這種錯配提供了基礎設施。
隨著更多職業被納入研究,隨著技術能力的演進和員工態度的變化,這個框架將幫助我們更好地理解并引導AI與人類工作的共同演化。
或許,真正的AI革命不在于創造最先進的算法,而在于創造真正服務于人的工具。
當硅谷的創新者們開始傾聽那些每天八小時坐在辦公桌前的人們的聲音時,當投資決策開始基于實際需求而非技術可能時,我們才能真正迎來人機協作的新時代。
· END ·
合 作 對 接
掃碼添加投資人說運營者微信,備注「商務合作」詳細溝通。
超 級 社 群
【投資人說】正在組建超級投資者社群、超級創業者社群、超級讀者群、超級媒體群等,目前總人數已超1000人。
關注【投資人說】微信公眾號,發送信息「進群」,與各行業精英直接交流,共同進步。
旗 下 媒 體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.