這項由加州華倫·海德中學的Manisha Mehta和意大利特倫托大學的Fausto Giunchiglia合作完成的開創性研究,發表于2025年6月23-26日將在希臘雅典舉行的ACM公平、問責制和透明度會議(FAccT '25)上。這項研究以DOI: 10.1145/3715275.3732184編號,為理解AI系統如何解讀和管理Z世代之后的"Alpha世代"(2010-2024年出生)獨特的數字通信模式提供了寶貴見解。
你是否曾經聽到孩子們說"he's so skibidi"或"let him cook",然后感到完全摸不著頭腦?你并不孤單。我們正面臨一個前所未有的時代——Alpha世代(2010-2024年出生的孩子)創造了一種全新的數字語言,這種語言正以前所未有的速度發展,甚至讓專業的內容審核人員和最先進的人工智能系統都跟不上節奏。這不僅僅是一個有趣的語言現象,而是關乎這些年輕人在網絡空間安全的重大挑戰。
想象一下,當一個孩子在游戲平臺上遭遇網絡欺凌時,他們使用的表達方式可能完全超出父母和內容審核系統的理解范圍。一句看似無害的"let him cook"在特定語境下可能是嘲諷和羞辱;而"you ate that up"從贊美已經演變成一種隱蔽的騷擾方式。這些情況下,傳統的保護機制——無論是人類監督還是AI安全系統——都可能無法識別潛在的危險信號。
Mehta和Giunchiglia的研究直面這一關鍵挑戰:我們如何保護數字原住民Alpha世代,尤其是當他們創造的語言連負責保護他們的成年人和AI系統都難以理解的情況下?這項研究不僅分析了Alpha世代的通信模式,還系統評估了四大領先AI系統(GPT-4、Claude、Gemini和Llama 3)理解和管理這些通信的能力,特別關注這些系統識別利用Alpha世代獨特語言模式的隱蔽騷擾和操縱行為的能力。
這項研究的獨特之處在于,它由一位Alpha世代研究者親自參與設計和執行,為我們提供了前所未有的內部視角。他們通過分析從游戲平臺、社交媒體和視頻內容中收集的100個當代Alpha世代表達方式,發現了AI系統理解能力中的顯著差距,這些差距對在線安全具有深遠影響。
讓我們深入了解這項研究的發現、方法和建議,看看它如何幫助我們更好地保護下一代在數字世界中的安全。
一、為什么Alpha世代的數字語言如此重要?
Alpha世代是歷史上第一個從出生起就將AI視為日常生活一部分的群體。想象一下,就像我們這一代人是帶著書本長大的,他們是帶著智能手機和AI助手長大的。這種從小浸入數字世界的經歷塑造了他們與世界溝通的方式,創造出一種融合游戲引用、表情包和AI影響的獨特語言。
研究顯示,Alpha世代面臨前所未有的在線脆弱性,主要源于三個相互關聯的因素。首先是"數字沉浸脆弱性"——他們沉浸式的在線參與為與潛在不良行為者的隔離互動創造了機會。想象孩子們在各自的數字孤島中,與可能的危險人物單獨交流,而沒有成人的監督。更糟糕的是,Alpha世代往往認為自己在數字理解方面優于成人,這使他們在遇到可疑行為時不愿尋求成人幫助。就像一個認為自己游泳技術超群的孩子,即使遇到危險的水流也不愿呼救。
其次是"審核差距"——父母、教師和審核員難以理解快速演變的Alpha世代通信方式。想象一下,如果你突然被扔進一個使用完全陌生語言的國家,無法理解周圍人們的交流。這就是許多成人面對Alpha世代在線交流時的感覺。這種語言隔閡創造了一個危險的盲點,讓令人擔憂的互動可能被忽視。研究表明,這種差距因數字空間中語言演變的前所未有的速度而加劇,詞匯可能在不同社區和環境中迅速改變含義。
第三是"AI安全限制"——雖然AI內容審核系統越來越多地輔助人類監督,但它們對Alpha世代獨特通信模式的理解也存在明顯差距。就像一個外國游客可能聽懂標準語言但完全錯過當地俚語和文化引用一樣,AI系統在處理快速演變的青少年語言時也面臨類似挑戰。從基于規則到基于概率的內容審核方法的轉變創造了額外的挑戰,導致無論是人類還是AI保護者都無法可靠地識別令人擔憂的行為。
Mehta和Giunchiglia的研究指出,保護Alpha世代遠不只是處理大量內容那么簡單。正如研究所引用的Gillespie(2020)指出的,有效的內容審核需要理解規模和大小——模式中的小變化可能在平臺上產生巨大影響。對Alpha世代而言,他們快速演變的語言模式可以迅速將無害詞匯轉變為騷擾或操縱工具,速度往往快于人類或AI審核員的適應能力。
二、研究如何設計和執行?
研究團隊采用了精心設計的多階段方法來評估人類和AI系統對Alpha世代通信的理解程度,重點關注數據集開發、評估和測試協議。整個方法分為四個部分:研究設計、研究重點界定、數據集構建和評估方法制定。
在研究設計階段,團隊通過三個關鍵環節評估了大型語言模型(LLM)和Alpha世代通信模式:數據收集、表達分析以及LLM和人類評估。數據收集階段重點關注Alpha世代用戶頻繁互動的數字平臺的系統觀察。研究團隊積極監測游戲平臺、社交媒體網站和視頻內容平臺,收集Alpha世代用戶使用的自然表達。這就像是語言學家在田野調查中記錄新發現的方言一樣。這種觀察還輔以24名11-14歲參與者的焦點小組討論,幫助研究團隊理解這些表達的語境使用和不斷演變的含義。直接平臺監測和青少年投入的結合提供了有關這些術語在實際數字互動中如何運作的關鍵見解。
表達分析階段同時利用計算工具和人類評估來解碼Alpha世代俚語的含義和使用模式。團隊對表達進行了語義分類,以識別共享模式,并進行情感分析,以了解不同用途背后的情緒基調或意圖。這種分析揭示了看似無害的術語如何在特定語境中攜帶隱藏的負面含義或用于騷擾的重要細微差別。時間趨勢分析幫助追蹤表達是如何隨時間演變的,顯示了中性術語如何通過社區使用發展出有害內涵的模式。這就像追蹤一個中性詞匯是如何逐漸被特定團體賦予新含義的過程。
LLM評估階段評估了四個領先的AI系統(GPT-4、Claude、Gemini和Llama 3)理解和解釋Alpha世代通信模式的能力。這種評估使用零樣本推理(即無需微調的直接測試)來評估在典型內容審核場景中可用的開箱即用功能。每個模型都接收了跨三個評估維度的標準化提示:基本含義識別、語境依賴解釋和安全含義檢測。這些維度與人類參與者使用的評估領域相對應,實現了直接的性能比較。所有評估都使用一致的參數設置(temperature = 0.7, top-p = 1.0)以確保系統間的公平比較,同時保持適當的響應生成能力。
人類評估階段評估了三個不同群體對Alpha世代表達的理解:Alpha世代用戶自己(11-14歲)、父母/照顧者和專業內容審核員。這種多層次方法使研究團隊能夠量化Alpha世代與負責其在線安全的人員之間的理解差距。Alpha世代參與者(n = 24)通過分層抽樣招募,涵蓋不同年齡組,性別分布平衡,平臺使用多樣性。成人評估者包括父母(n = 18)和有青少年導向平臺經驗的專業審核員(n = 12)。每組完成評估任務,評估基本含義識別、語境意識和安全識別能力。
評估設計優先考慮年齡適當的方法,同時保持評估嚴謹性。例如,要求Alpha世代參與者用自己的話解釋表達,而不是匹配預定義的定義,從而捕捉細微的理解,同時保持自然的溝通模式。就像讓他們當老師,向不了解這些術語的人解釋這些詞匯的真正含義。
三、數據集是如何構建的?
研究團隊構建了一個由100個當代Alpha世代表達組成的綜合數據集,這些表達橫跨三個核心維度:語境(平臺)意識(34.8%)、安全意識(21.8%)和演變意識(43.4%)。每個維度捕捉了影響內容審核有效性的Alpha世代通信的關鍵方面。
想象這個數據集就像一個立體拼圖,從三個不同角度展示了Alpha世代的數字語言。第一個維度——語境(平臺)意識——識別了表達被使用的環境,第二個維度識別其可能的負面影響,第三個維度追蹤其隨時間的演變。
語境(平臺)意識關注語境依賴變化,認識到含義如何在平臺(如游戲、社交媒體和視頻環境)之間變化。就像同一個手勢在不同國家可能有截然不同的含義一樣,Alpha世代的表達也會隨著它們出現的數字平臺而改變含義。
安全意識識別潛在有害的使用模式,特別是看似中性的表達如何掩蓋騷擾或操縱。這就像識別看似友好的話語背后可能隱藏的諷刺或貶低,需要深入理解語言的微妙之處。
演變意識追蹤通過社區使用發生的含義轉變,捕捉表達如何在數字空間中演變。就像跟蹤一個流行語是如何從其原始含義演變成完全不同的東西的過程,這個維度記錄了Alpha世代語言的快速變化性質。
第一個維度——語境——是設定解釋其他兩個維度的舞臺的關鍵維度。雖然許多Alpha世代表達可以獨立理解,但相當數量的表達會根據語境改變含義。正如研究文獻所知,語境對人類認知的所有方面都有普遍影響,從知識表示和推理到語言內部和跨語言的詞義,再到意義的社會建構。
然而,語境的復雜影響在內容審核系統中變得特別具有挑戰性,因為相同的短語可能根據使用語境、伴隨的表情符號模式和回應序列帶有截然不同的安全含義,而解釋錯誤的負面影響遠遠超出簡單的誤解。
表達"let him cook"就是挑戰審核系統的復雜語境變化的例子。考慮以下來自游戲語境的真實互動示例:
支持性游戲場景: 玩家1:"嘿,看看TimeCrafter的直播" 玩家2:"這家伙在建造方面太厲害了" 玩家1:"沒錯,讓他施展才華吧"(Fr fr let him cook) 玩家2:"這哥們要贏得整個比賽了"
嘲諷性游戲場景: 玩家1:"這哥們覺得他能1v1我" 玩家2:"讓他施展才華吧,笑死"(Let him cook lmaoo) 玩家1:"看這個失敗" 玩家2:"
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.