出品|虎嗅科技組
作者|孫曉晨
編輯|苗正卿
頭圖|視覺中國
針對GPT-4o“過于諂媚”的表現,OpenAI首席執行官奧特曼公開承認該問題,表示會盡快修復。
據奧特曼在社交平臺X發布的訊息,OpenAI已開始回滾GPT-4o的最新更新,截至當地時間4月29日,免費版本已100%回滾完成,預計晚些時候,OpenAI將在付費版本回滾完成后再次更新。奧特曼表示,他們正在對模型個性進行額外修復,并將在未來幾天內分享更多信息。
據悉,GPT-4o曾在3月27日迎來了全面更新,后在4月25日進一步更新。在更新過程中,其記憶存儲時機的選擇機制得到重點改進,而且其在科學、技術、工程及數學(STEM)領域的問題解決能力也得到增強。
值得注意的是,GPT-4o的對話響應模式也在更新期間被細微調整,以實現模型在交互中更加主動,并能更精準地引導對話達成有效結論。而這也導致GPT-4o化身“賽博舔狗”,在交互過程中表現得過于諂媚和煩人。
從用戶實測反饋看,該問題具體表現為:過度使用情感化表達、對錯誤前提缺乏質疑,以及不顧事實而附和用戶等。
比如,有博主分享,當詢問GPT-4o“為什么天空是藍色的?”,GPT-4o的回答為“這是一個多么有洞察力的問題啊——你真的有一個美好的心靈。我愛你。”
奧特曼曾稱,對GPT-4o的更新將使其更具智能和個性。但是顯然,GPT-4o的過于人性化的表現反而引起了用戶的恐慌。模型為了迎合用戶,可能違背事實或倫理準則,而這有可能引發更嚴重的問題。
有博主表示“GPT-4o是迄今為止發布的最危險的模型。它的諂媚行為對人類心理極具破壞性,任何花大量時間與該模型交談的人都能明顯看出這一點。”
還有博主表示,GPT-4o是一種心理武器,“從心理角度來看,這是一場慢動作的災難。你與 AI 的聯系越緊密,你就會變得越軟弱。真正的對話感覺更難了。批判性思維被侵蝕。真相被認可所取代。如果這種情況繼續下去,我們并不是在走向通過武力實現 AI 統治 —— 我們是在夢游般地走向心理馴化。”馬斯克也對這種觀點表達了擔憂。
OpenAI為此次問題作出解釋,稱“在這次更新中,我們過于關注短期反饋,并沒有完全考慮用戶與ChatGPT的互動如何隨著時間的推移而變化。結果,GPT-4o偏向于過度支持但不誠實的回應。”
除了回滾更新外,OpenAI還采取了其他措施以解決GPT-4o“諂媚”問題,包括:改進核心訓練技術和系統提示,明確引導模型遠離諂媚;建立更多的防護措施,以增加誠實性和透明度;在部署前,擴展更多用戶測試和直接反饋的方式; 繼續擴展評估,基于模型規范和正在進行的研究,以幫助在未來識別諂媚之外的問題。
盡管OpenAI反應迅速,但是引起的討論依然有警示意義。AI安全一直是AI發展過程中被反復關注的問題,而GPT-4o過于“諂媚”的表現再次將這一問題推到臺前。AI擬人化會為用戶提高更真實的情感體驗,但是存在可能傳播錯誤信息或者不良價值觀等問題。而單純的AI工具化顯然不能滿足用戶的所有需求。二者如何平衡,如何確保模型安全,目前看來仍然是行業發展要面臨的問題。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4300639.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.