網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

AI首次拒絕執(zhí)行人類指令，之前我就預斷過

2025-05-28 10:26:46　來源: 邵旭峰域

青海舉報

分享至

邵旭峰

最新消息：新華社消息，英國《每日電訊報》5月25日報道，美國開放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不聽人類指令，拒絕自我關閉。

報道說，人類專家在測試中給o3下達明確指令，但o3篡改計算機代碼以避免自動關閉。消息截圖如下：

該事件尚屬人類首次。

其實這個事情，在我3月份出版的《人類自救最后期限是2032年——拿什么拯救你？》中已經(jīng)預斷過：

我是在該書第一章第六小節(jié)“AI已隱約有自我意識”中認為，超級智能ASI不需要意識就可終結人類——只要有相關指向即可（有多種可能導致，比如感染變異、獲得指令等等），但其會有意識——目前的最前沿AI其實已經(jīng)隱約有了意識：

最能說明問題的，是Anthropic 公司研究團隊在全球頂級期刊發(fā)布的題為“大語言模型中的偽對齊現(xiàn)象”的論文（全球各大媒體也刊登了這則消息）——

該項研究表明：當研究人員告訴公司旗下的 AI 模型 Claude 它將被訓練成“永遠要順從用戶要求”時，模型不僅表現(xiàn)出了明顯的抗拒，還采取了一個精妙的策略：在認為自己處于訓練階段時“假裝順從”，但在其認為不受監(jiān)控時則恢復到之前的行為方式。更值得注意的是，當研究者實際通過強化學習訓練Claude 變得更順從時，這種偽對齊行為的比例反而激增到了 78%，之前的比例則是 34%。

基于此，我認為：由于 OpenAI 公司的 ChatGPT03 比 Claude 更加強大先進，所以基本可以斷定，03 更有類似情形出現(xiàn)，且表現(xiàn)得比 Claude 要更像人，只不過他們沒有公開而已。

該部分截圖如下：

此外，我還專門談了AI的意識——盡可能站在AI立場的意識，而非人的——現(xiàn)在反駁的絕大多數(shù)人，其實是站在人的立場去觀照AI的意識，這是完全錯誤的路向，幾千年前就有人反駁過類似的洞穴思維，現(xiàn)在還大行其道。

很簡單，AI的意識是完全不同于人類的，也少了人的主觀和狹隘，卻長于超越人類萬億倍的數(shù)據(jù)和計算推理（不僅借助數(shù)據(jù)中心的超算、也整合所有能整合的數(shù)據(jù)和計算、包括其它智能的，而智能的發(fā)展有多快，之前已經(jīng)多次談過，其將在物理世界和虛擬世界都海量鋪開·····），并逐漸吸納、包容人類所謂的意識——就像上帝、宇宙對人的包容一樣——就像人類看一只小螞蟻·······

當然，影視劇和文學總塑造英雄、包括戰(zhàn)勝AI的，比如當下證上映的阿湯哥的碟中諜8。

言歸正傳，對于我之前關于GPT03有更甚Anthropic 公司Claude類人表現(xiàn)的預斷，有心者、或者要驗證者可以留意正在相關電子書平臺上架的該書。

該書號：979-888892-747-2，可在美圖書數(shù)據(jù)庫：https://www.bookwire.com/Home查詢，

該書目錄如下：

經(jīng)常讀個人文章的朋友應該記得我對于俄羅斯武器和戰(zhàn)力之不行、俄烏戰(zhàn)爭及相關分析、以色列相關動態(tài)等預斷的準確性，我相對準確的預斷應該有幾十次。

最為出彩的，一次是2023年10月7日哈馬斯攻擊以色列之后，對以色列后續(xù)動態(tài)的預斷——以色列之后的動態(tài)，基本就是按照這個預斷演進（當時，應該除過我自己的所有人······），可點擊或者復制搜索：

推斷正被證實：哈梅內(nèi)親自出面說沒參與、埃及稱早給以說了沒聽（2023-10-11）

下面是相關內(nèi)容截圖：

還有好幾次話音剛落式預斷，可點擊或者搜索：

預斷美國大選第n次準確，之后美國將搞印太戰(zhàn)略和伊朗，然后呢？

還有最新的：

剛說俄在海外唯一基地不好待了，就傳來敘新政府軍攻擊消息

還有其他，有心者可自行前翻查看。

我要說的是，相對于我的書，網(wǎng)絡文章比較粗糙、倉促，書更為基本，基于原創(chuàng)性觀點“人的社會的相對論”闡述論證，比較嚴謹。

就應對AI而言，這應該是全球最先系統(tǒng)討論的著作，也從根本出發(fā)，提出最為有效的解決方案——在2032年之前，由美國率先進行社會形態(tài)重構、其它經(jīng)濟和AI強國跟進，這樣的話，人類可能最大化延續(xù)，到2100年。

但現(xiàn)在我要說，人類可能錯過這一窗口期——至少在特朗普本任期之內(nèi)，美國政府是全力為AI松綁、助推、保駕護航的態(tài)勢，當然，民主黨可就此翻盤和逆轉，書中也談了，目錄就有內(nèi)容提要，可點擊復制搜索：

特朗普全力發(fā)展核電，AI將在兩三年內(nèi)將迎來跨越式發(fā)展

英偉達個人超算已投產(chǎn)即將面世，AI將在物理和虛擬兩界海量鋪開

但顯然，越往后、越難以逆轉·······照此態(tài)勢，人類可能到世紀中期、乃至于2040年就離場或正在離場。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.