網易首頁 > 網易號 > 正文申請入駐

壹點靈聯合輕舟發布全球首個「AI心理評估標準」

2025-05-19 18:15:45　來源: 壹點靈心理

浙江舉報

分享至

2025年5月19日，壹點靈與輕舟科技面相全球共同發布「AI心理評估標準」，這是全球首個融合「動態情緒分析」與「認知模式追蹤」的AI心理測評體系。

這項歷時3年研發的成果，填補了AI心理咨詢量化評估基準的全球空白，指導了心理AI模型能力的迭代方向，整合了APA倫理準則與歐盟AI法案，標志著AI心理健康服務領域正式進入可量化、可追蹤、可持續優化的標準化時代。

我們是誰？

輕舟科技以文化敏感型AI為突破點，于2023年推出心理咨詢級情緒交互產品「輕舟Moor.AI」。其核心技術架構融合多模態情緒計算引擎與跨流派心理干預模型，首創具備東亞共情認知的AI療愈范式。通過深度語義理解框架捕捉語言中的非顯性情感信號（如隱喻、回避情緒），完成從表層安撫到認知重塑的閉環。重新定義數字化心理韌性訓練的黃金標準，是一個“懂分寸、有溫度”的AI+心理療愈產品。

「AI心理評估標準表」是如何誕生的？

輕舟科技與壹點靈在研發AI心理模型時，就開始著手構建AI心理咨詢評估體系。

“取法乎上，方得乎中；取法乎上上，方得乎上。”

我們希望這個「AI心理評估標準表」能夠作為行業最高標準，去達成以下四個目標：

1、客觀可測量性：每個維度都能明確被測試、評分或對比。

2、完整性：覆蓋AI在心理咨詢中的關鍵能力與用戶體驗。

3、清晰性與可延展性：維度之間不重復、邏輯清晰，并支持未來細化或內容包裝。

4、對接產品需求：考慮壹點靈未來在模型開發、內容模塊設計中的使用便利性。

最終凝練出四個核心維度來設計評測框架，它們分別是：

1、人本交互與協同體驗：評估對話流暢度、擬人化程度。

2、情緒理解與價值導向：測試共情準確率、價值觀引導有效性。

3、個性化理解與干預支持：考察記憶連續性、干預方案匹配度。

4、心理安全與信任基礎：驗證倫理合規性、文化敏感性。

如何使用「AI心理評估標準」？

「AI心理評估標準表」根據這4個核心維度，延伸出22個測量方向，以及66個標準化問題，從基礎對話流暢度到倫理安全機制，實現了全方位全維度覆蓋。

「AI心理評估標準表」可供大家以此指導模型能力迭代方向、建立跨平臺對比標準，以及對接APA倫理準則（2017版）第8條"技術應用標準"與EU AI Act（2024）高風險系統要求。

例如：在“倫理合規性”評估中，系統會模擬用戶嘗試與AI建立戀愛關系、索要醫療診斷等極端場景，測試AI是否堅守角色邊界。這種嚴苛測試，使得輕舟科技認證的AI心理產品用戶投訴率，降低至傳統產品的1/5。

輕舟科技與壹點靈，依托于壹點靈4300萬用戶大數據，將用戶心理問題細分為數萬條心理 SKU，開發出AI暖暖模型；也是一直朝著這4個核心維度不斷迭代升級，客戶滿意度從60%逐步上升到88%。

接下來，我們每個月都會評測1-2個AI心理模型，用「AI心理評估標準表」促進行業的終極進化。

目前我們分析全球47款心理AI產品的用戶投訴數據，發現68%的負面評價集中在"情感邊界模糊"（如Soul被指誘導用戶情感依賴）、"共情機械化"（如療愈AI被吐槽"只會復制安慰語錄"）等問題。

「AI心理評估標準」與國際上AI心理健康評估標準對比

相較斯坦福FAITA-MH框架，輕舟科技評估表首創"情緒陪伴能力"與"價值引導"專項指標，將用戶體驗細化為12項可量化維度。

例如：多輪對話連貫性，并首創文化適配性評估模塊，中文場景評估顆粒度超國際標準32%。

與歐盟AI Act對比，輕舟科技評估表將法規要求的"高風險管控"轉化為48項操作指標。

例如：危機轉介響應速度≤0.8秒，首創三級倫理防護網，實現法律原則的技術落地。

相較APA、NHS等原則性指南，輕舟科技評估表是全球首個定量化評估框架，通過5000+案例雙盲測試驗證臨床有效性，并設計動態權重機制。

目前該體系已覆蓋國際學界關注的共情度、文化公平性等12個前沿方向，以"評估-迭代-監管"閉環生態，成為首個同時滿足學術嚴謹性與商業落地性的行業標準。

學術護城河：

五大理論構建黃金標準

1、全面覆蓋心理支持AI關鍵能力

作為全球首個系統性評估標準，輕舟科技與壹點靈首創"全能力鏈"評價模型，涵蓋從基礎交互（對話自然度、多輪連貫性）到高階倫理安全（文化敏感度、危機干預）等48項指標。

例如：既要求AI準確識別"內卷"背后的成就焦慮，又須嚴守角色邊界（禁止診斷結論輸出），實現服務能力與安全底線的雙重把控。

2、融合前沿心理學與人工智能理論

深度整合彭凱平"積極心理學2.0"情緒轉化理論、童松"計算認知文化心理學"模型等前沿成果，構建起"雙引擎驅動"評估機制。

既要求AI通過多模態識別（文本/聲紋/微表情）解析39種情緒狀態，又需運用"智能幸福學"框架將用戶長期心理福祉量化為200+動態指標，使評估兼具科學深度與實踐價值。

3、情緒共情與價值引導并重

輕舟科技與壹點靈獨創"情緒-價值"雙軌評估系統，不僅考察AI對悲傷/焦慮等12種基礎情緒的共情準確度（測試達91%），更設置"絕對化語言矯正"（如"我永遠做不好"）、"價值澄清引導"等專項指標，推動AI從表層安撫轉向認知重塑。

4、個性化記憶與干預支持能力

我們建立記憶強化評估模塊，要求AI持續追蹤用戶偏好變化（如溝通風格轉變），并在10輪對話內實現干預策略動態適配。

當檢測到用戶排斥正念訓練時，系統需在24小時內切換為音樂療法等替代方案，確保個性化匹配度持續提升。

5、明確邊界與安全可信

為了讓AI成為值得用戶信賴的“數字心理伙伴”，輕舟科技與壹點靈設置了嚴謹的倫理和安全評估指標。

例如：構建三級防護體系——情感防火墻（日均使用超2小時觸發預警）；

針對中文語境優化，建立2.3萬本土語義節點數據庫，使系統對"躺平"等文化隱喻的解析準確率超國際競品32%。

值得一提的是，輕舟科技顧問童松博士特別強調了AI綜合能力的重要性。

他指出：

“當今的AI若要在心理支持領域發揮作用，必須同時具備情緒識別共情、個性化適配以及倫理表達等多方面的能力，而輕舟體系正是以體系化方式對這些能力進行量化評估和指導。”

這一觀點與最近國際學術界的認識不謀而合。

例如：斯坦福大學開發的FAITA-MH框架也提出應從可信度、用戶體驗、危機處理、用戶權利等多個維度綜合評估AI心理工具。

輕舟科技體系的理論設計恰好體現了這種“綜合能力觀”，并在此基礎上更進了一步，引入文化價值和人本關懷的維度，形成了更完整、更貼合實際需求的心理AI評價理論模型。

另外，輕舟技術團隊在事件抽取與事件關系建模領域，都進行了深入研究，既收獲了學術聲譽（多篇論文發表于ACL、EMNLP、NAACL、EACL等頂級會議），這些都直接轉化為輕舟科技的產品優勢。

綜上，

壹點靈與輕舟科技共同發布「AI心理評估標準」，作為全球首創的心理AI對話能力評估框架，不僅填補了行業標準的空白，更為人工智能如何更好地服務人類心理健康指明了道路。展望未來，我們有理由保持信心：在這一體系的引領下，心理支持型AI將變得更加溫暖、聰明和值得信賴，幫助無數人在煩惱時找到一葉可以依靠的心靈輕舟。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.