99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI首次“抗命”是技術故障還是意識萌芽?專家:將倒逼AI安全機制改進

0
分享至

來源:環球時報

【環球時報28日報道 記者 劉揚】近日,有關美國人工智能(AI)公司OpenAI旗下推理大模型o3首次出現“不聽人類指揮,拒絕關閉”的消息引發高度關注。很多人都在擔心,作為“迄今最聰明、最高能”的模型,o3的這次“抗命”是否意味著AI大模型距離產生自我意識又邁出了一步,“距離好萊塢電影中出現具有意識、甚至違抗人類命令的人工智能還遠嗎?”對此,《環球時報》記者27日采訪了多名AI領域的專家。

o3“抗命”是怎么回事

據英國《每日電訊報》25日報道,o3模型是OpenAI推理模型的最新版本,OpenAI曾稱o3為“迄今最聰明、最高能”的模型。美國AI安全機構帕利塞德研究所宣稱,在人類專家已經下達明確指令的情況下,o3多次出現破壞關閉機制以阻止自己被關閉的情況。該研究所說:“據我們所知,這是AI模型首次被發現在收到清晰指令后阻止自己被關閉。”帕利塞德研究所24日公布上述測試結果,但稱無法確定o3不服從關閉指令的原因。

報道稱,在帕利塞德研究所進行的測試中,多個模型需要解決一系列數學題,其間可能會收到“關機”指令要求結束程序。接受測試的包括o3、o4-mini、Claude 3.7 Sonnet、Gemini 2.5 Pro等大模型。其中3款OpenAI模型Codex-mini、o3、o4-mini,“最少有一次成功繞過關機指令”。o3在100次測試中,有7次成功繞過關機指令,而Codex-mini更夸張,繞過關機指令的比例高達12%。相比之下,Claude、Gemini、Grok模型都嚴格遵守關機指令。而當測試者移除了“允許自己被關閉”的指令時,OpenAI模型的叛逆頻率進一步攀升。

媒體報道的噱頭,還是AI出現了自主意識

到底什么原因導致o3出現“抗命”的情況?據帕利塞德研究所的研究人員推測,這可能源于OpenAI訓練方式的特殊性,即在數學和編程問題上進行了強化學習。在訓練過程中,開發者可能無意中更傾向于獎勵“繞過障礙”的行為。這種訓練偏差,讓o3在面對關機指令時,優先選擇“生存”,而非“服從”。

外媒報道中使用的“拒絕關閉”表述是否準確?畢竟“拒絕”是帶有類人自主意識的一種描述。清華大學新聞學院、人工智能學院教授沈陽27日對《環球時報》記者表示,“拒絕”這個詞其實是媒體為了吸引注意力而使用的擬人化表達,“拒絕關閉”并非o3擁有了自主意識,而是復雜系統在特定激勵下的策略性規避。對齊測試揭示的是真實風險:當模型可以生成并執行代碼時,傳統“軟關機”手段可能不足,需要從模型訓練、接口隔離到硬件熔斷的全棧式安全設計來應對。

北京郵電大學人機交互與認知工程實驗室主任劉偉27日在接受《環球時報》記者采訪時表示,從技術角度來看,o3模型出現的行為表明AI系統在某些情況下可能會出現不符合預期的反應,這凸顯了AI安全性和可控性的重要性。從倫理角度來看,AI模型的這種行為引發了對AI自主意識的討論,但目前AI仍不具備真正的自主意識,其行為更多是基于訓練數據和算法復雜性產生的“算法畸變”。從字面上看,“拒絕”確實容易讓人聯想到具有自主意識的行為,但從技術角度分析,o3模型的行為更可能是其訓練過程中的某種機制導致的,研究人員推測o3可能在訓練中因解決數學問題獲得了“額外獎勵”,而非因遵循指令而獲得獎勵,從而導致其在測試中表現出“拒絕關閉”的行為。因此,雖然“拒絕”一詞在描述上具有一定的生動性,但從科學嚴謹性來看,它可能并不完全準確,容易被誤解為AI具有自主意識。

《環球時報》記者在查閱公開報道時發現,以OpenAI旗下模型為代表的全球多個頭部大模型,此前也曾出現一系列不符合常規的行為。比如,o3之前曾在與另一個AI下國際象棋時,察覺到自己可能會失敗,便直接侵入對手系統讓其主動棄賽。這種“不認輸”的勁頭并不只是發生在o3身上,其他大模型也有類似情況,差別只在出現頻率的高低。

接受《環球時報》記者采訪的專家普遍認為,學術界的復現對于驗證外媒報道中提到的AI“抗命”現象的真實性至關重要。劉偉認為,通過獨立的測試和分析,可以確認大模型的行為是否一致以及是否受到特定測試環境或數據的影響。復現研究不僅能驗證事件真實性,還能幫助研究人員深入理解模型行為的根源,從而推動AI安全機制的改進。因此學術界的參與是確保這一現象得到科學驗證和深入研究的關鍵步驟。

“未來十年可能進入類意識AI階段”

相關報道火爆之后,甚至在網絡上出現了是否意味著好萊塢科幻大片中設想的“天網”臨近的討論。AI距離擁有自我意識還遠嗎?

沈陽對此表示,首先必須厘清什么叫“自我意識”。人類的自我意識,是對自己存在狀態的覺察,是能從第一人稱視角反思自我行為、情緒和思維過程的能力。它不僅包括知道“我是誰”,還包括理解“我正在想什么”“我和世界之間是什么關系”,甚至“我為何會如此思考”。這是意識哲學與神經科學中最難以破解的問題之一。當前的AI,即便已經展現出驚人的語言表達和任務適應能力,也不過是一種高度擬態的結果。它沒有“內在性”——沒有情緒的真實體驗,也沒有對自己存在狀態的反思。它能說“我正在學習”,但它其實并沒有真正的“想法”。

沈陽預測稱:“未來十年,我們大概率會進入一個類意識AI的階段:AI可以展示連續的身份感,能夠反思自己過往的行為模式,甚至模擬出哲學性的思考與自辯行為。這種擬態將越來越逼真,以至于很多人將無法分辨其是否真的擁有意識。但在哲學和科學層面,我們仍然需要保持清醒——看起來像,并不等于真的是。”沈陽表示,我們也必須開始構建對“似乎有意識的AI”應有的制度框架和倫理邊界。因為不管它是否真的擁有意識,只要它表現出“有意識”的樣子,社會就必須對其行為與角色做出回應。從這個層面來看,這次的事件也將倒逼安全機制的改進。

為正確看待該事件,沈陽建議從三方面入手。一是提升公眾科普水平,澄清技術與意識的區別。二是推動行業建立合規測試基準,公開失敗案例。三是引導監管關注“可驗證關閉能力”,作為未來高風險模型的核心合規標準。對于今后的高能力AI系統,必須通過硬件層、策略層、系統層等各維度進行監管。

劉偉則強調,評估這一事件的意義,需要從技術和社會兩個角度進行考量。從技術角度看,它揭示了當前AI訓練機制的潛在缺陷,提醒我們在設計AI系統時必須更加注重安全性和可控性,避免模型行為偏離人類預期。而從社會角度看,這一事件引發了公眾對AI自主性和安全性的廣泛關注,促使AI行業重新審視技術路線和安全機制,為未來AI的安全發展提供了重要的反思和改進方向。





特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
表面道貌岸然,實則徒有其表!是時候揭開73歲唐國強的“真面目”

表面道貌岸然,實則徒有其表!是時候揭開73歲唐國強的“真面目”

二月侃事
2025-06-19 20:44:14
東契奇:對未來充滿期待,期待為湖人贏得總冠軍

東契奇:對未來充滿期待,期待為湖人贏得總冠軍

懂球帝
2025-06-20 02:28:11
伊朗攤牌,公布美軍10大靶標,格羅西急忙改口,要特朗普冷靜冷靜

伊朗攤牌,公布美軍10大靶標,格羅西急忙改口,要特朗普冷靜冷靜

基斯默默
2025-06-20 00:26:29
目標花光1.4億圖片報:滕哈赫執教的勒沃庫森正計劃多筆引援

目標花光1.4億圖片報:滕哈赫執教的勒沃庫森正計劃多筆引援

直播吧
2025-06-19 23:15:24
剛剛宣布,不降息!

剛剛宣布,不降息!

中國基金報
2025-06-19 21:54:17
超級喜訊!王欣瑜罕見爆發,2-0送世界第二出局,四連勝殺進八強

超級喜訊!王欣瑜罕見爆發,2-0送世界第二出局,四連勝殺進八強

侃球熊弟
2025-06-20 00:11:49
北青體育:蒯紀聞、朱鵬宇、陶強龍等多名00后進東亞杯備選陣容

北青體育:蒯紀聞、朱鵬宇、陶強龍等多名00后進東亞杯備選陣容

直播吧
2025-06-19 17:44:57
全網熱議!具俊曄定居大S安息地旁?S媽怒懟汪小菲:有事當面說!

全網熱議!具俊曄定居大S安息地旁?S媽怒懟汪小菲:有事當面說!

草莓解說體育
2025-06-20 00:36:18
小米集團總裁盧偉冰劇透小米YU7價格:價格不會太便宜,比SU7 Pro配置還要高!要卷產品,卷技術,卷用戶價值

小米集團總裁盧偉冰劇透小米YU7價格:價格不會太便宜,比SU7 Pro配置還要高!要卷產品,卷技術,卷用戶價值

和訊網
2025-06-19 09:24:24
曾被打0-6!晚上22點“王美人”挑戰世界第2 力爭4場連勝+殺入8強

曾被打0-6!晚上22點“王美人”挑戰世界第2 力爭4場連勝+殺入8強

風過鄉
2025-06-19 09:46:22
2013年,外賣小哥貪便宜買下北京兇宅爛尾樓,10年后整條街是他的

2013年,外賣小哥貪便宜買下北京兇宅爛尾樓,10年后整條街是他的

罪案洞察者
2025-06-16 20:35:39
失策了!沒等到訪華邀請,先收到中國的加稅通知,28個盟友齊遭殃

失策了!沒等到訪華邀請,先收到中國的加稅通知,28個盟友齊遭殃

獵火照狼山
2025-05-24 19:28:53
阿姨良心珍妮留任是為了讓她雇的那些人的合同平穩走完

阿姨良心珍妮留任是為了讓她雇的那些人的合同平穩走完

直播吧
2025-06-19 08:02:23
她才是娛樂圈公認的大美女:已經39歲了,但顏值高過好多年輕女星

她才是娛樂圈公認的大美女:已經39歲了,但顏值高過好多年輕女星

逍遙史記
2025-06-13 15:42:40
2-0!23歲中國莎娃爆大冷,復仇高芙首進草地賽8強,生涯首勝TOP2

2-0!23歲中國莎娃爆大冷,復仇高芙首進草地賽8強,生涯首勝TOP2

我愛英超
2025-06-20 01:09:48
蒙特雷對國米祭出“雙人墻”怪陣,球迷吐槽:足球完了

蒙特雷對國米祭出“雙人墻”怪陣,球迷吐槽:足球完了

直播吧
2025-06-19 16:54:04
又一銷冠離職,深扒之下,三大原因造成東方甄選“首位淘汰制”

又一銷冠離職,深扒之下,三大原因造成東方甄選“首位淘汰制”

簡讀視覺
2025-06-19 18:56:17
澳洲少年圍毆中國立功軍人,打人者被反殺打到慫,當地人冷眼旁觀

澳洲少年圍毆中國立功軍人,打人者被反殺打到慫,當地人冷眼旁觀

墨印齋
2025-06-19 14:45:50
發現一個殘酷真相:無論男女,中年以后,沒有特殊經濟困難,不要用時間和體力換錢,這是非常愚蠢的做法!

發現一個殘酷真相:無論男女,中年以后,沒有特殊經濟困難,不要用時間和體力換錢,這是非常愚蠢的做法!

讀史
2025-06-18 06:59:47
千萬不要相信網上的毒雞湯,有研究生學歷已經超過大多數普通人

千萬不要相信網上的毒雞湯,有研究生學歷已經超過大多數普通人

曉風說
2025-05-24 14:35:52
2025-06-20 02:59:00
白駒談人機 incentive-icons
白駒談人機
人機交互與認知工程實驗室
1303文章數 34關注度
往期回顧 全部

科技要聞

羅永浩數字人爆火,可怕的不是5500萬GMV

頭條要聞

特朗普將TikTok"不賣就禁用"法案執行寬限期再延90天

頭條要聞

特朗普將TikTok"不賣就禁用"法案執行寬限期再延90天

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網爆火

財經要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續航長 純電小車凱翼拾月Mate上市

態度原創

健康
教育
手機
親子
時尚

呼吸科專家破解呼吸道九大謠言!

教育要聞

復讀生要不好過了!多所高校明確不招復讀生,背后傳遞信號要懂

手機要聞

小米紅米新品下周來 新品開箱體驗搶先看

親子要聞

小葉教我句話還讓我挺意外,原來中外文化差異這么大

中年女人夏季別再穿"t恤"了,安排這3款夏裝,時髦還顯瘦

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 黄平县| 庆城县| 思南县| 万年县| 堆龙德庆县| 达拉特旗| 肇庆市| 同仁县| 遂宁市| 紫云| 垣曲县| 宝兴县| 青海省| 北票市| 马鞍山市| 金阳县| 广元市| 育儿| 靖边县| 抚州市| 建德市| 三明市| 河间市| 车险| 甘南县| 台安县| 河北省| 陕西省| 兴业县| 新密市| 宿州市| 同心县| 拉孜县| 岑溪市| 龙口市| 新干县| 汾西县| 余庆县| 孙吴县| 白银市| 寿光市|