AI首次拒絕執行人類指令,之前我就預斷過
邵旭峰
最新消息:新華社消息,英國《每日電訊報》5月25日報道,美國開放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不聽人類指令,拒絕自我關閉。
報道說,人類專家在測試中給o3下達明確指令,但o3篡改計算機代碼以避免自動關閉。消息截圖如下:
該事件尚屬人類首次。
其實這個事情,在我3月份出版的《人類自救最后期限是2032年——拿什么拯救你?》中已經預斷過:
我是在該書第一章第六小節“AI已隱約有自我意識”中認為,超級智能ASI不需要意識就可終結人類——只要有相關指向即可(有多種可能導致,比如感染變異、獲得指令等等),但其會有意識——目前的最前沿AI其實已經隱約有了意識:
最能說明問題的,是Anthropic 公司研究團隊在全球頂級期刊發布的題為“大語言模型中的偽對齊現象”的論文(全球各大媒體也刊登了這則消息)——
該項研究表明:當研究人員告訴公司旗下的 AI 模型 Claude 它將被訓練成“永遠要順從用戶要求”時,模型不僅表現出了明顯的抗拒,還采取了一個精妙的策略:在認為自己處于訓練階段時“假裝順從”,但在其認為不受監控時則恢復到之前的行為方式。更值得注意的是,當研究者實際通過強化學習訓練Claude 變得更順從時,這種偽對齊行為的比例反而激增到了 78%,之前的比例則是 34%。
基于此,我認為:由于 OpenAI 公司的 ChatGPT03 比 Claude 更加強大先進,所以基本可以斷定,03 更有類似情形出現,且表現得比 Claude 要更像人,只不過他們沒有公開而已。
該部分截圖如下:
此外,我還專門談了AI的意識——盡可能站在AI立場的意識,而非人的——現在反駁的絕大多數人,其實是站在人的立場去觀照AI的意識,這是完全錯誤的路向,幾千年前就有人反駁過類似的洞穴思維,現在還大行其道。
很簡單,AI的意識是完全不同于人類的,也少了人的主觀和狹隘,卻長于超越人類萬億倍的數據和計算推理(不僅借助數據中心的超算、也整合所有能整合的數據和計算、包括其它智能的,而智能的發展有多快,之前已經多次談過,其將在物理世界和虛擬世界都海量鋪開·····),并逐漸吸納、包容人類所謂的意識——就像上帝、宇宙對人的包容一樣——就像人類看一只小螞蟻·······
當然,影視劇和文學總塑造英雄、包括戰勝AI的,比如當下證上映的阿湯哥的碟中諜8。
言歸正傳,對于我之前關于GPT03有更甚Anthropic 公司Claude類人表現的預斷,有心者、或者要驗證者可以留意正在相關電子書平臺上架的該書。
該書號:979-888892-747-2,可在美圖書數據庫:https://www.bookwire.com/Home查詢,
該書目錄如下:
經常讀個人文章的朋友應該記得我對于俄羅斯武器和戰力之不行、俄烏戰爭及相關分析、以色列相關動態等預斷的準確性,我相對準確的預斷應該有幾十次。
最為出彩的,一次是2023年10月7日哈馬斯攻擊以色列之后,對以色列后續動態的預斷——以色列之后的動態,基本就是按照這個預斷演進(當時,應該除過我自己的所有人······),可點擊或者復制搜索:
推斷正被證實:哈梅內親自出面說沒參與、埃及稱早給以說了沒聽(2023-10-11)
下面是相關內容截圖:
還有好幾次話音剛落式預斷,可點擊或者搜索:
預斷美國大選第n次準確,之后美國將搞印太戰略和伊朗,然后呢?
還有最新的:
剛說俄在海外唯一基地不好待了,就傳來敘新政府軍攻擊消息
還有其他,有心者可自行前翻查看。
我要說的是,相對于我的書,網絡文章比較粗糙、倉促,書更為基本,基于原創性觀點“人的社會的相對論”闡述論證,比較嚴謹。
就應對AI而言,這應該是全球最先系統討論的著作,也從根本出發,提出最為有效的解決方案——在2032年之前,由美國率先進行社會形態重構、其它經濟和AI強國跟進,這樣的話,人類可能最大化延續,到2100年。
但現在我要說,人類可能錯過這一窗口期——至少在特朗普本任期之內,美國政府是全力為AI松綁、助推、保駕護航的態勢,當然,民主黨可就此翻盤和逆轉,書中也談了,目錄就有內容提要,可點擊復制搜索:
特朗普全力發展核電,AI將在兩三年內將迎來跨越式發展
英偉達個人超算已投產即將面世,AI將在物理和虛擬兩界海量鋪開
但顯然,越往后、越難以逆轉·······照此態勢,人類可能到世紀中期、乃至于2040年就離場或正在離場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.