人工智能發展日新月異,其“智能”究竟達到了何種程度?AI與人類PK孰強孰弱?對勞動力市場將產生多大沖擊?在哪些工作崗位中部署AI更具經濟價值?這些都是企業CEO和政策制定者在當下所關注的核心問題。
長江商學院科技與運營杰出院長講席教授孫天澍在近日被信息系統領域國際頂級期刊《信息系統研究》(Information Systems Research,ISR)正式接受的合作 論文《從人類智能視角解析生成式AI:系列實驗研究》 (Unraveling Generative AI from A Human Intelligence Perspective: A Battery of Experiments)中,開創性地提出首個基于“人類智能”的AI智能水平系統性評估框架,對上述問題的思考提供了新視角。
研究速遞
● 研究首次揭示了AI大模型(LLMs)在認知、情緒、社交和創造性四大核心人類智能維度上的能力邊界。GPT-4在認知、情緒、創造性三項智能已超人類,但“社交智能”仍是短板。
● 研究為518個職業類別分別構建了完整的“智能需求畫像”,衡量大模型是否“具備勝任崗位所需智能”,發現:AI大模型與計算機、法律、金融、新聞編輯等“智能密集型”知識崗位適配度最高;而在服務類、生產制造、運輸物流類崗位,AI智能適配度偏低。
● 高度智能匹配度不意味著高經濟價值與投資回報。研究發現第三產業崗位(如銷售、辦公室助理、行政支持、客戶運營等)是AI真正紅利洼地,成為AI部署的首選目標領域。
● 研究構建了一個可部署、可復用的“AI職業智能評估系統”,幫助企業衡量和對比多個模型(如GPT-4)在不同崗位上的表現與價值,指導人機協同的未來組織。
隨著大模型逐步融入人類社會,為了理解其潛在影響,確保其有效運作并在以人為中心的結構中無縫共存、共創,有必要通過人類標準評估大模型的能力邊界。
而無論在學術界還是產業界,都長期缺乏從“人類智能”視角全面評估人工智能的系統性衡量方法。現有對AI大模型能力的評估,大多局限在AI完成標準化考試、代碼生成等技術任務上。這種基于“特定任務”的衡量方式,難以洞悉AI在認知、情感、社交、創造等人腦核心能力上的真實水平,更無法為更廣范圍的人機協作提供有效指導。
智能不僅僅是執行特定任務的低級能力,它還包括解決問題和推理、泛化知識、管理情緒、展示社交和人際技能、展現創造力以及對世界的深刻理解等更高級的視角。目前,大模型是否真正擁有這些更深層次的智能仍然是該領域一個復雜且未解決的問題。
針對這一關鍵研究空白,長江商學院科技與運營杰出院長講席教授孫天澍與馬里蘭大學史密斯商學院助理教授王雯、上海財經大學商學院助理教授裴思琦在被頂級期刊ISR接受的合作論文中從“以人為本”的視角出發,基于人類行為理論和實驗,創新提出以人類智能為基準,全面理解大模型整體智能的新框架。
“人類智能評估人工智能”的框架將大模型類比為人類,從認知、情感、社交和創造智能四個維度理解大模型智能的完整范圍,并通過大規模對比實驗,首次揭示了大模型(LLMs)在認知、情緒、社交和創造性四大核心人類智能維度上的能力邊界及其對勞動力市場的深遠影響,填補了從人類中心視角評估AI智能水平的研究空白。
Information Systems Research(《信息系統研究》)是世界公認的管理學頂級期刊UTD24列表中信息管理類排名第一的期刊,創刊于1990年,在國際管理科學界享有極高學術聲譽。Information Systems Research同時是英國金融時報Financial Times評定的50本商學院頂級期刊(簡稱FT50)之一。
Information Systems Research聚焦信息系統對企業、組織和社會的影響,覆蓋信息技術、管理科學、經濟學、心理學等多個學科的交叉研究,主要發表信息系統設計、開發、實施、管理以及應用等方面的文章。
長江商學院科技與運營教授、杰出院長講席教授、數字化轉型研究中心主任孫天澍教授表示:
隨著AI加速進入產業應用,AI Agent指數級涌現,人機協作場景激增,我們需要全新的、從人類智能視角出發的AI智能評估標準,以便更全面地理解、評估與掌握AI大模型的能力邊界,指導和支持未來的人機協作。
希望這一新框架能為企業和政策制定者提供可復用的決策工具,幫助他們判斷何時何地以何種方式將大模型有效的融合進‘以人為本’的工作場景和社會分工中。
圖注:孫天澍教授合作團隊基于心理學和行為經濟學首創從人類智能評估AI新框架,按人類智能視角劃分為四大核心維度進行人類智能–人工智能對比實驗
該研究基于近一世紀人類行為科學的研究理論,將大模型智能按人類智能視角劃分為四大核心維度:
● 認知智能 (Cognitive Intelligence)
● 情緒智能 (Emotional Intelligence)
● 社交智能 (Social Intelligence)
● 創造智能 (Creativity)
孫教授與合作團隊設計并實施了大規模的人類智能–人工智能對比實驗,涵蓋676名人類參與者,包括來自不同教育背景(三類教育層次)及職業背景(管理類與技術類崗位)的參與者,系統評估大模型在四大核心人類智能維度、17個子智能維度上的表現。
同時,孫教授團隊開展了大規模專家評估實驗,招募了2296名領域專家,覆蓋23個職業大類、518個職業類別,用于精確評估不同職業對多維智能的需求,并據此支持大模型的職業智能匹配與職業替代分析。此外,從人類智能對人工智能的評估包含17類行為實驗、共327項具體任務,針對每個任務對GPT-3、GPT-3.5和GPT-4等模型分別重復運行50次,從而構建出穩健且高置信度的大模型智能畫像。
上述人類實驗、專家評估與高頻大模型測試相結合,形成了目前關于人工智能的最系統、最全面的人本視角評估之一,為本文的研究發現與政策建議提供了堅實而可信的實證支撐。獨特闡釋了大語言模型對全球勞動力市場影響背后的潛在原理,以及對未來人機協同智能組織的展望。
研究團隊發現:
發現一: AI三項智能超人類,但“社交智能”仍是致命短板
研究團隊發現,大模型的“人類智能”譜系呈現出鮮明的優勢與短板:
結果令人震驚:GPT-4在三項智能上已經全面超越人類平均水平:
?認知智能:比如邏輯推理、系統思維
?情緒智能:情緒調節、態度調控
?創造智能:發散思維、創新想象
但也揭示出一個顯著短板——社交智能嚴重不足。
GPT-4在“社交興趣”“自我效能”“心理狀態理解”等關鍵子維度都遠低于人類平均,缺乏共情力和真實社會連接。這意味著它仍難以勝任教育、心理咨詢、客戶服務等“人情味”要求高的工作。
而且從GPT-3到GPT-4雖然認知和情緒能力飛躍顯著,但社交智能幾乎無進展,說明目前大模型訓練機制本身存在局限。
發現二: 用“智能供需匹配”理解職業沖擊,開辟新視角
本研究的一項重大突破是,首次提出通過人類智能維度來連接AI模型能力與職業需求,實現從“智能供需匹配”角度理解AI對崗位的沖擊與價值。
傳統評估大模型對勞動力市場的影響,多基于任務分解與語言匹配(如Eloundou等2023),難以解釋“為什么AI適合某類崗位,卻無法勝任另一類”。而本研究提出的智能框架,則為每個崗位構建一套完整的“智能需求畫像”,為每個大模型生成“智能能力畫像”,并通過17個智能子維度的映射,衡量模型是否“具備勝任崗位所需智能”。
這一方法的核心思想是:每一份工作都要求一組特定的智能能力,而每個大模型也有其智能強弱配置。因此,職業影響本質上取決于“模型智能”是否覆蓋“崗位智能需求”這一核心關系。
這不僅彌補了傳統方法在解釋機制上的缺陷,還為組織與政策制定者提供了系統、透明、可解釋的評估工具,可用于崗位設計、AI部署、再培訓路徑規劃等關鍵場景。
職業-LLMs智能適配的關鍵發現:
?GPT-4 與“智能密集型”知識崗位高度契合
通過智能匹配計算,GPT-4與計算機、法律、金融、新聞編輯等高認知與情緒智能要求崗位匹配度最高,說明這些崗位最適合AI深度嵌入
?服務、與人接觸類崗位適配度低,社交智能成為制約關鍵
如客服、護理、運輸等崗位雖然任務結構清晰,但GPT-4在社交興趣、共情理解、自我效能等社交子維度能力明顯不足,導致難以勝任這些高人際互動的工作。
?智能匹配得分與“崗位準備難度”高度一致,驗證方法有效性
研究發現,GPT-4的崗位暴露度與O*NET工作準備等級呈正相關(Job Zone系數顯著),驗證了該智能匹配方法不僅具備預測力,還可作為一套通用評估標準推廣。
研究將人類的智能能力框架引入到職業分析中,結合23類典型工作,評估GPT-4是否“具備勝任這些崗位所需的智能”,結論發現,GPT-4 適配度最高的職業集中在:計算機、金融、法律、媒體等知識密集型崗位;而在服務類、生產制造、運輸物流類崗位,GPT-4智能適配度偏低,原因是缺乏社交智能與情境感知。
發現三: 經濟價值分布:高智能 ≠ 高價值,第三產業才是AI真正紅利洼地
高智能不等于高價值:雖然GPT-4在多個知識密集型崗位上表現出高度智能匹配度,如科研、法律、金融分析、創意寫作等第四產業典型崗位,模型在這些領域的認知與創造能力甚至遠超人類平均水平,展現出強大的“崗位勝任力”。
然而,這些崗位本身存在兩個天然限制:
?崗位數量少,整體市場體量小:例如科研人員或專業法律顧問相對于行政或客服崗位,基數極小;
?替代后邊際收益有限:許多高認知崗位本身并非流程化操作,自動化潛力有限,模型能力雖強但使用頻率或場景受限。
因此,這類高智能匹配崗位雖然“技術適配度”高,卻在經濟價值釋放方面存在明顯上限,難以支撐企業或社會層面的大規模投資回報。
第三產業成最大價值洼地:匹配中等但收益潛力最大. 相比之下,許多第三產業崗位(如銷售、辦公室助理、行政支持、客戶運營等)雖然在智能匹配上并非最優,但由于具備以下兩個優勢,反而成為AI部署的首選目標領域:
?崗位數量龐大,需求旺盛:這些崗位廣泛存在于各行各業,構成服務業核心人力結構;
?平均工資不低,替代后能顯著降低人力成本:尤其在發達經濟體,行政與銷售崗位的薪資水平使得替代潛力具有極強吸引力。
模型雖在某些社交能力維度上仍存在短板(如共情、心理狀態識別),但在大部分流程性、標準化溝通任務中已足以勝任。此類“中智能–高體量–高成本”的崗位組合,使得其在經濟價值曲線上達到最高點。
未來政策制定和勞動力發展重點:深耕AI難替代的“人性化”技能
該研究同時為應對AI挑戰指明方向——對政策制定和勞動力發展而言,勞動力培訓應側重于那些不易被大模型取代的人性化技能。自動化社交互動的復雜性,確保了在人工智能驅動的經濟中,人類勞動者仍不可或缺。
發現四: 一個可以實際用的“AI職業智能評估系統”
該研究不僅提出了一個理論框架,更構建出一個可部署、可復用的智能評估系統。該框架支持以下兩類企業決策:
?縱向評估(Vertical Evaluation):衡量一個模型(如GPT-4)在多個崗位上的表現與價值
?橫向比較(Horizontal Comparison):企業可對比多種模型,選出最適配崗位需求的版本
例如:在“銷售崗位”對比中,GPT-3.5與GPT-4顯著優于GPT-3,但兩者之間差距不大;提示對于情緒/社交智能要求較高的崗位,GPT-3.5已可達可用門檻,GPT-4的增量有限。
這一研究可謂恰逢其時。2025年《政府工作報告》提出,持續推進“人工智能+”行動,將數字技術與制造優勢、市場優勢更好結合起來,支持大模型廣泛應用,大力發展智能網聯新能源汽車、人工智能手機和電腦、智能機器人等新一代智能終端以及智能制造裝備。與此同時,人工智能對勞動力市場的結構性沖擊也日益引發關注。
孫天澍教授帶領長江商學院數字化轉型中心的研究團隊圍繞人工智能,商業重構與產業轉型,開展了一系列學術研究、案例整理和實踐調研,系統性梳理了企業人工智能大模型的商業設計與產業場景落地。
這篇學術論文不僅提出了一個以人類智能為基準全面評估大模型的整體智能的全新視角和框架,也通過多場景案例演示展示了其作為可復用的創新評估體系。對于企業決策者而言,這一框架可協助科學評估各崗位部署AI的風險與收益,制定“以人為本”的人機協同策略,精準投入資源,最大化AI的經濟價值。在政策制定領域,該框架也為預測AI對勞動力市場的結構性影響、制定針對性再培訓政策和產業發展規劃提供了重要維度的依據與參考。
孫天澍教授簡介
孫天澍教授現任長江商學院科技與運營終身教授、杰出院長講席教授,企業家學者DBA項目學術主任,數字化轉型中心主任,在南加州大學獲得終身教職以及Robert Dockson講席教授,同時兼任商學院與計算機系博士生導師。
孫天澍的研究跨界結合AI數字化技術設計與商業設計,聚焦在企業和產業的“AI業務架構”和“業務數字化轉型”,特別是AI場景設計,AI業務重構,AI智能組織,AI人才體系,數據資產,信息系統,以及業務數字化戰略。孫天澍在中美頂尖企業有豐富的工作經歷與合作實踐(如Facebook,Adobe等),并擔任多家中國頂級企業的董事和資深顧問,數字化商業設計、數據科學方法和AI算法系統在多個行業的全鏈路場景落地。孫天澍近年的學術研究和產業實踐尤其關注AI與商業的融合與重構—特別是AI大模型,AI智能體,大數據,云計算,物聯網和具身智能如何持續的改變全渠道零售,快消,醫藥,金融,智能制造,餐飲生活和企業服務等行業。
孫天澍受邀在頂級大學(哈佛,MIT,沃頓商學院,芝加哥,斯坦福等)以及國際頂級學術會議上發表八十多場學術演講,并在Facebook, Google, Snapchat, 領英, 優步, 阿里巴巴, 中信集團, 人民日報集團等頂級機構做AI大模型,數字化轉型,數據資產和平臺戰略的邀請分享和培訓。
孫天澍的研究論文發表在信息系統,機器學習,運籌優化,經濟學和商學院國際頂級期刊與會議,獲得16項最佳論文獎(包括芝加哥大學頒發的Wittink Prize年度最佳論文獎),以及南加州大學頒發的年度最佳教授獎(Golden Apple Award)。
孫天澍教授擔任多個國際頂級期刊常務和客座編委(MS, ISR, MISQ, MSOM)和國際會議大會聯席主席(CIST,WEBEIS),并獲得多個頂級機構的研究支持,指導的博士學生在UIUC、Queens、ASU、SCU等學校擔任教職,培養的研究助理和研究生在MIT、沃頓商學院、康奈爾、明尼蘇達、香港科技大學等攻讀博士。
孫天澍本科畢業于南京大學物理系,在馬里蘭大學修讀物理,電子工程與經濟學博士課程,獲得信息系統博士學位。
自創校起,長江商學院憑借“學術研究立校”“教授治學”等一系列機制創新,吸引匯聚了一批在世界管理學術界享有盛譽的學者全職加入長江。學院為教授提供了較為成熟的、具有一定全球競爭力的學術研究平臺及生態體系,使得教授能在加入長江后仍然能持續開展前沿性、引領性的研究,不斷產生世界級的研究成果,獲得全球學術界的廣泛認可。
2024年,長江商學院教授在UTD24商學院頂級期刊上的人均發表量位列中國大陸院校第一,充分彰顯了學院的學術實力和國際影響力。
來源:Information Systems Research
掃描二維碼,查看完整論文
長江學術
end
點擊下方卡片,關注長江商學院
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.