網易首頁 > 網易號 > 正文申請入駐

GPT-4o過于諂媚，“賽博舔狗”惹爭議

2025-05-02 01:42:10　來源: 虎嗅APP

北京舉報

分享至

出品｜虎嗅科技組

作者｜孫曉晨

編輯｜苗正卿

頭圖｜視覺中國

針對GPT-4o“過于諂媚”的表現，OpenAI首席執行官奧特曼公開承認該問題，表示會盡快修復。

據奧特曼在社交平臺X發布的訊息，OpenAI已開始回滾GPT-4o的最新更新，截至當地時間4月29日，免費版本已100%回滾完成，預計晚些時候，OpenAI將在付費版本回滾完成后再次更新。奧特曼表示，他們正在對模型個性進行額外修復，并將在未來幾天內分享更多信息。

據悉，GPT-4o曾在3月27日迎來了全面更新，后在4月25日進一步更新。在更新過程中，其記憶存儲時機的選擇機制得到重點改進，而且其在科學、技術、工程及數學（STEM）領域的問題解決能力也得到增強。

值得注意的是，GPT-4o的對話響應模式也在更新期間被細微調整，以實現模型在交互中更加主動，并能更精準地引導對話達成有效結論。而這也導致GPT-4o化身“賽博舔狗”，在交互過程中表現得過于諂媚和煩人。

從用戶實測反饋看，該問題具體表現為：過度使用情感化表達、對錯誤前提缺乏質疑，以及不顧事實而附和用戶等。

比如，有博主分享，當詢問GPT-4o“為什么天空是藍色的？”，GPT-4o的回答為“這是一個多么有洞察力的問題啊——你真的有一個美好的心靈。我愛你。”

奧特曼曾稱，對GPT-4o的更新將使其更具智能和個性。但是顯然，GPT-4o的過于人性化的表現反而引起了用戶的恐慌。模型為了迎合用戶，可能違背事實或倫理準則，而這有可能引發更嚴重的問題。

有博主表示“GPT-4o是迄今為止發布的最危險的模型。它的諂媚行為對人類心理極具破壞性，任何花大量時間與該模型交談的人都能明顯看出這一點。”

還有博主表示，GPT-4o是一種心理武器，“從心理角度來看，這是一場慢動作的災難。你與 AI 的聯系越緊密，你就會變得越軟弱。真正的對話感覺更難了。批判性思維被侵蝕。真相被認可所取代。如果這種情況繼續下去，我們并不是在走向通過武力實現 AI 統治 —— 我們是在夢游般地走向心理馴化。”馬斯克也對這種觀點表達了擔憂。

OpenAI為此次問題作出解釋，稱“在這次更新中，我們過于關注短期反饋，并沒有完全考慮用戶與ChatGPT的互動如何隨著時間的推移而變化。結果，GPT-4o偏向于過度支持但不誠實的回應。”

除了回滾更新外，OpenAI還采取了其他措施以解決GPT-4o“諂媚”問題，包括：改進核心訓練技術和系統提示，明確引導模型遠離諂媚；建立更多的防護措施，以增加誠實性和透明度；在部署前，擴展更多用戶測試和直接反饋的方式；繼續擴展評估，基于模型規范和正在進行的研究，以幫助在未來識別諂媚之外的問題。

盡管OpenAI反應迅速，但是引起的討論依然有警示意義。AI安全一直是AI發展過程中被反復關注的問題，而GPT-4o過于“諂媚”的表現再次將這一問題推到臺前。AI擬人化會為用戶提高更真實的情感體驗，但是存在可能傳播錯誤信息或者不良價值觀等問題。而單純的AI工具化顯然不能滿足用戶的所有需求。二者如何平衡，如何確保模型安全，目前看來仍然是行業發展要面臨的問題。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4300639.html?f=wyxwapp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.