摘要
在傳統的機器學習范式中,人類往往只是訓練數據的提供者,或是模型決策的被動接受者。但近年來,一種新的協作式智能浪潮正在興起。在2022年發表于 Artificial Intelligence Review 上的一篇綜述,系統梳理了這一轉變路徑:AI正從“自動執行命令”的封閉系統,走向“與人協同共學”的開放架構。在這篇前沿綜述中,研究者將人類重新引入模型訓練的核心環節,從主動學習、交互式學習,到機器教學與課程設計,重構人機智能協同的新秩序。
本周六下午伍海燕老師將進行的第一次分享,探討人工智能如何通過復雜社會行為建模、高生態效度實驗任務構建及人機互動理解,重塑社會決策研究框架,介紹“啟策認知(CogniAND)”平臺,推動傳統實驗范式向融合多主體交互與認知機制的轉型,助力AI提升社會理解與適應能力。
關鍵詞:人在環路、主動學習、交互式機器學習、機器教學、課程學習、可解釋 AI
趙思怡丨作者
周莉丨審校
論文題目:Human-in-the-loop machine learning: a state of the art 發表時間:2022年8月17日 論文地址:https://link.springer.com/article/10.1007/s10462-022-10246-w 發表期刊:Artificial Intelligence Review
研究人員正在探索一種稱為“人在環路”機器學習的新領域,旨在定義人類與機器學習算法之間多樣化的協作方式。根據控制權的不同,主要形式包括:由系統主導的主動學習、用戶與模型緊密互動的交互式機器學習,以及由人類專家引導模型學習的機器教學。此外,人類還可通過課程學習為模型提供結構化樣例以提升學習效率,或借助可解釋AI理解模型的決策邏輯。這種人機協作不僅限于訓練過程,還延伸至“可用且有用的人工智能”(Usable and Useful AI)等新概念,強調技術在實際應用中的易用性與實用性。本文旨在梳理相關概念,澄清術語歧義,明確方法邊界,并揭示各類技術之間的內在聯系與相互影響,系統呈現該領域的研究現狀與發展脈絡。
人機協同機器學習:讓AI更懂人類需求
近年來,人工智能(AI)在醫療診斷、金融風控、自動駕駛等關鍵領域加速落地,但傳統機器學習(ML)模型仍面臨諸多瓶頸。一方面,其高度依賴大量標注數據,訓練成本高昂;另一方面,“黑箱”特性導致決策過程難以解釋,缺乏透明性和可控性,嚴重制約了可信度與社會接受度。隨著應用場景的拓展,這種封閉式訓練模式暴露出越來越多問題:適應性差、更新滯后、依賴人工標注等。為破解這一困境,研究者提出了人在環路機器學習(Human-in-the-loop Machine Learning, HITL-ML)的理念,強調在模型訓練與優化中建立更緊密的人機協作機制,使人類從被動的數據提供者轉變為積極的參與者。
圖1:人在環路機器學習(HITL-ML)思維導圖
根據人類在學習流程中扮演的不同角色,HITL-ML衍生出了多種路徑,包括主動學習(Active Learning, AL)、交互式機器學習(Interactive Machine Learning, IML)、機器教學(Machine Teaching, MT)、課程學習(Curriculum Learning, CL)及可解釋AI(Explainable AI, XAI)等。這些方法共同推動著機器學習從傳統的“離線訓練、靜態部署”的封閉模式,向更加靈活的“動態交互、持續進化”的開放范式轉變。這種轉變不僅提高了模型的性能和適應性,還增強了系統的透明度和用戶的信任感,預示著未來AI技術發展的新方向。
主動學習(AL):讓系統學會“提問”
在傳統機器學習中,模型被動接受標注數據,而AL賦予算法“提問權”——系統主動選擇對提升性能最關鍵的未標注樣本,交由人類專家標注。這一過程的核心在于設計查詢策略,例如基于不確定性采樣優先選擇模型預測模糊的數據,或通過多樣性采樣覆蓋數據分布的盲區。AL的典型應用場景包括醫學影像標注和自然語言處理(NLP)。例如,在癌癥病理報告分類中,AL可減少80%的標注工作量,同時保持高準確率。然而,AL的局限性在于假設人類標注者始終可靠,且忽略交互中的認知負荷。若系統頻繁請求標注瑣碎樣本,可能導致用戶疲勞,甚至降低標注質量。
交互式機器學習(IML):動態協作的新模式
如果說AL是“系統主導”,IML則強調人機的雙向互動。用戶不僅作為標注者,還能通過可視化界面實時調整模型參數、修正錯誤預測,甚至參與特征工程。例如,音樂生成工具Wekinator允許音樂家通過手勢實時訓練模型,即時調整生成旋律的風格。IML的成功關鍵在于用戶體驗(UX)設計。以生態學研究工具AIDE為例,用戶通過拖拽標注圖像中的動物行為,模型即時更新并反饋檢測結果,形成“標注-訓練-驗證”的閉環。這種動態交互尤其適合處理非結構化數據(如視頻、傳感器信號),但其挑戰在于平衡算法效率與用戶認知負擔,避免陷入“過度調試”的困境。
圖2:交互式機器學習(IML)學習過程的示意圖
機器教學(MT):專家知識的定向傳遞
MT將人類教師置于核心地位,強調通過結構化課程設計引導模型學習。與AL和IML不同,MT的教師需預先規劃教學順序,例如從簡單病例到復雜病癥的漸進教學,模擬人類教育中的“循序漸進”原則。
圖3:機器教學(MT)過程的示意圖
微軟團隊開發的PICL系統是MT的典型代表。醫生通過標注關鍵醫學特征(如腫瘤邊緣),并解釋診斷邏輯,幫助模型建立可解釋的決策路徑。MT的優勢在于降低對標注數據量的依賴,但其難點在于如何將專家經驗轉化為機器可理解的課程邏輯。近年來,迭代機器教學(Iterative Machine Teaching)通過強化學習自動優化教學順序,成為突破方向。
課程學習(CL):模仿人類的學習路徑
CL受人類教育啟發,主張按難度遞增的順序訓練模型。例如,在圖像識別中,先讓模型學習清晰圖像,再逐步加入噪聲或遮擋樣本。研究表明,合理的課程設計可加速模型收斂,提升魯棒性。CL的核心挑戰在于量化樣本“難度”。傳統方法依賴人工定義(如句子長度、圖像復雜度),而自步學習(Self-Paced Learning, SPL)等自動化技術通過模型損失動態調整訓練集,實現“越學越難”的自適應過程。在神經機器翻譯(NMT)中,CL可將訓練效率提高30%,同時減少對噪聲數據的敏感度。
可解釋AI(XAI):打破黑箱的信任基石
當AI應用于醫療診斷等高風險場景時,模型的可解釋性至關重要。XAI通過可視化、特征歸因等技術揭示模型決策邏輯。例如,在卷積神經網絡(CNN)中,Grad-CAM可高亮影響分類的關鍵圖像區域;在循環神經網絡(RNN)中,注意力機制能展示文本分類的依據詞匯。XAI的終極目標是建立用戶信任。研究顯示,醫生更傾向于采納能提供病例對比和決策鏈解釋的AI輔助系統。然而,當前多數XAI工具仍面向技術人員,如何為非專家設計直觀的可視化界面,仍是亟待解決的難題。
從“可用”到“有用”:AI與社會的深度協同
超越技術層面,人機協同理念正推動AI向“可用和有用AI”(Usable and Useful AI)進化。前者關注用戶體驗,例如通過交互設計降低標注門檻;后者強調社會價值,確保AI符合倫理規范并滿足真實需求。例如,在慢性病管理中,AI系統可結合患者日常數據(如運動量、血糖值)生成個性化建議,并通過對話式交互(如聊天機器人)解釋推薦理由,形成“監測-決策-反饋”的良性循環。這種以人為中心的設計,正是第三波AI浪潮的核心方向。
未來展望:人機共生下的智能新范式
人在環路機器學習并非單一技術的堆砌,而是涵蓋算法、交互、倫理的復雜體系。當前趨勢顯示:
交互增強:從被動標注到實時協作,AR/VR技術將進一步提升人機交互的自然性。
自動化工具:AutoML與MLOps平臺正在降低HITL-ML的開發門檻,使領域專家能直接參與模型迭代。
可信AI:通過XAI與倫理審查的結合,構建“透明且負責任”的智能系統。
圖4:HITL-ML及其相關關系的思維導圖
未來,隨著腦機接口、聯邦學習等技術的成熟,人機協同模式或將從“人類指導機器”發展為“雙向認知協同”,真正實現人工智能與人類社會的共生共榮。
「大模型時代下的人機交互與協同」
讀書會
在智能時代,雖然機器學習和深度學習算法在自然語言處理、計算機視覺和語音識別等領域取得了顯著進展,但這些技術依賴大量標注數據,并在面對復雜動態環境時表現出決策能力的局限,特別是在需要直覺、創造力和道德判斷的任務上遠遜于人類。相比之下,人類智能能夠基于背景信息在不完全條件下高效決策,適應變化與不確定性,并作出倫理情感驅動的判斷。因此,單純依靠機器智能難以滿足復雜任務需求,人機協同成為必要選擇,通過兩者緊密合作,既能利用機器的運算速度和處理能力,又能借助人類智慧和創造力,實現更高效智能的決策與創新。
在此背景下,集智俱樂部聯合中國科學技術大學教授趙云波、華東師范大學副教授吳興蛟兩位老師共同發起。本次讀書會將探討:人類智能和機器智能各自的優勢有哪些?智能邊界如何?如何通過更有效的標注策略和數據生成技術來解決數據稀缺問題?如何設計更加高效的人機協作系統,實現高效共贏的效果?如何提高機器決策的可解釋性與透明性,確保系統的可信度?如何通過多模態協作融合不同感知通道,應對復雜的決策任務? 讀書會從7月5日開始,預計持續約8周。誠摯邀請領域內研究者、尋求跨領域融合的研究者加入,共同探討。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.