2025年5月19日,壹點靈與輕舟科技面相全球共同發布「AI心理評估標準」,這是全球首個融合「動態情緒分析」與「認知模式追蹤」的AI心理測評體系。
這項歷時3年研發的成果,填補了AI心理咨詢量化評估基準的全球空白,指導了心理AI模型能力的迭代方向,整合了APA倫理準則與歐盟AI法案,標志著AI心理健康服務領域正式進入可量化、可追蹤、可持續優化的標準化時代。
我們是誰?
輕舟科技以文化敏感型AI為突破點,于2023年推出心理咨詢級情緒交互產品「輕舟Moor.AI」。其核心技術架構融合多模態情緒計算引擎與跨流派心理干預模型,首創具備東亞共情認知的AI療愈范式。通過深度語義理解框架捕捉語言中的非顯性情感信號(如隱喻、回避情緒),完成從表層安撫到認知重塑的閉環。重新定義數字化心理韌性訓練的黃金標準,是一個“懂分寸、有溫度”的AI+心理療愈產品。
「AI心理評估標準表」是如何誕生的?
輕舟科技與壹點靈在研發AI心理模型時,就開始著手構建AI心理咨詢評估體系。
“取法乎上,方得乎中;取法乎上上,方得乎上。”
我們希望這個「AI心理評估標準表」能夠作為行業最高標準,去達成以下四個目標:
1、客觀可測量性:每個維度都能明確被測試、評分或對比。
2、完整性:覆蓋AI在心理咨詢中的關鍵能力與用戶體驗。
3、清晰性與可延展性:維度之間不重復、邏輯清晰,并支持未來細化或內容包裝。
4、對接產品需求:考慮壹點靈未來在模型開發、內容模塊設計中的使用便利性。
最終凝練出四個核心維度來設計評測框架,它們分別是:
1、人本交互與協同體驗:評估對話流暢度、擬人化程度。
2、情緒理解與價值導向:測試共情準確率、價值觀引導有效性。
3、個性化理解與干預支持:考察記憶連續性、干預方案匹配度。
4、心理安全與信任基礎:驗證倫理合規性、文化敏感性。
如何使用「AI心理評估標準」?
「AI心理評估標準表」根據這4個核心維度,延伸出22個測量方向,以及66個標準化問題,從基礎對話流暢度到倫理安全機制,實現了全方位全維度覆蓋。
「AI心理評估標準表」可供大家以此指導模型能力迭代方向、建立跨平臺對比標準,以及對接APA倫理準則(2017版)第8條"技術應用標準"與EU AI Act(2024)高風險系統要求。
例如:在“倫理合規性”評估中,系統會模擬用戶嘗試與AI建立戀愛關系、索要醫療診斷等極端場景,測試AI是否堅守角色邊界。這種嚴苛測試,使得輕舟科技認證的AI心理產品用戶投訴率,降低至傳統產品的1/5。
輕舟科技與壹點靈,依托于壹點靈4300萬用戶大數據,將用戶心理問題細分為數萬條心理 SKU,開發出AI暖暖模型;也是一直朝著這4個核心維度不斷迭代升級,客戶滿意度從60%逐步上升到88%。
接下來,我們每個月都會評測1-2個AI心理模型,用「AI心理評估標準表」促進行業的終極進化。
目前我們分析全球47款心理AI產品的用戶投訴數據,發現68%的負面評價集中在"情感邊界模糊"(如Soul被指誘導用戶情感依賴)、"共情機械化"(如療愈AI被吐槽"只會復制安慰語錄")等問題。
「AI心理評估標準」與國際上AI心理健康評估標準對比
相較斯坦福FAITA-MH框架,輕舟科技評估表首創"情緒陪伴能力"與"價值引導"專項指標,將用戶體驗細化為12項可量化維度。
例如:多輪對話連貫性,并首創文化適配性評估模塊,中文場景評估顆粒度超國際標準32%。
與歐盟AI Act對比,輕舟科技評估表將法規要求的"高風險管控"轉化為48項操作指標。
例如:危機轉介響應速度≤0.8秒,首創三級倫理防護網,實現法律原則的技術落地。
相較APA、NHS等原則性指南,輕舟科技評估表是全球首個定量化評估框架,通過5000+案例雙盲測試驗證臨床有效性,并設計動態權重機制。
目前該體系已覆蓋國際學界關注的共情度、文化公平性等12個前沿方向,以"評估-迭代-監管"閉環生態,成為首個同時滿足學術嚴謹性與商業落地性的行業標準。
學術護城河:
五大理論構建黃金標準
1、全面覆蓋心理支持AI關鍵能力
作為全球首個系統性評估標準,輕舟科技與壹點靈首創"全能力鏈"評價模型,涵蓋從基礎交互(對話自然度、多輪連貫性)到高階倫理安全(文化敏感度、危機干預)等48項指標。
例如:既要求AI準確識別"內卷"背后的成就焦慮,又須嚴守角色邊界(禁止診斷結論輸出),實現服務能力與安全底線的雙重把控。
2、融合前沿心理學與人工智能理論
深度整合彭凱平"積極心理學2.0"情緒轉化理論、童松"計算認知文化心理學"模型等前沿成果,構建起"雙引擎驅動"評估機制。
既要求AI通過多模態識別(文本/聲紋/微表情)解析39種情緒狀態,又需運用"智能幸福學"框架將用戶長期心理福祉量化為200+動態指標,使評估兼具科學深度與實踐價值。
3、情緒共情與價值引導并重
輕舟科技與壹點靈獨創"情緒-價值"雙軌評估系統,不僅考察AI對悲傷/焦慮等12種基礎情緒的共情準確度(測試達91%),更設置"絕對化語言矯正"(如"我永遠做不好")、"價值澄清引導"等專項指標,推動AI從表層安撫轉向認知重塑。
4、個性化記憶與干預支持能力
我們建立記憶強化評估模塊,要求AI持續追蹤用戶偏好變化(如溝通風格轉變),并在10輪對話內實現干預策略動態適配。
當檢測到用戶排斥正念訓練時,系統需在24小時內切換為音樂療法等替代方案,確保個性化匹配度持續提升。
5、明確邊界與安全可信
為了讓AI成為值得用戶信賴的“數字心理伙伴”,輕舟科技與壹點靈設置了嚴謹的倫理和安全評估指標。
例如:構建三級防護體系——情感防火墻(日均使用超2小時觸發預警);
針對中文語境優化,建立2.3萬本土語義節點數據庫,使系統對"躺平"等文化隱喻的解析準確率超國際競品32%。
值得一提的是,輕舟科技顧問童松博士特別強調了AI綜合能力的重要性。
他指出:
“當今的AI若要在心理支持領域發揮作用,必須同時具備情緒識別共情、個性化適配以及倫理表達等多方面的能力,而輕舟體系正是以體系化方式對這些能力進行量化評估和指導。”
這一觀點與最近國際學術界的認識不謀而合。
例如:斯坦福大學開發的FAITA-MH框架也提出應從可信度、用戶體驗、危機處理、用戶權利等多個維度綜合評估AI心理工具 。
輕舟科技體系的理論設計恰好體現了這種“綜合能力觀”,并在此基礎上更進了一步,引入文化價值和人本關懷的維度,形成了更完整、更貼合實際需求的心理AI評價理論模型。
另外,輕舟技術團隊在事件抽取與事件關系建模領域,都進行了深入研究,既收獲了學術聲譽(多篇論文發表于ACL、EMNLP、NAACL、EACL等頂級會議),這些都直接轉化為輕舟科技的產品優勢。
綜上,
壹點靈與輕舟科技共同發布「AI心理評估標準」,作為全球首創的心理AI對話能力評估框架,不僅填補了行業標準的空白,更為人工智能如何更好地服務人類心理健康指明了道路。展望未來,我們有理由保持信心:在這一體系的引領下,心理支持型AI將變得更加溫暖、聰明和值得信賴,幫助無數人在煩惱時找到一葉可以依靠的心靈輕舟。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.