AI首次拒絕執(zhí)行人類指令,之前我就預斷過
邵旭峰
最新消息:新華社消息,英國《每日電訊報》5月25日報道,美國開放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不聽人類指令,拒絕自我關閉。
報道說,人類專家在測試中給o3下達明確指令,但o3篡改計算機代碼以避免自動關閉。消息截圖如下:
該事件尚屬人類首次。
其實這個事情,在我3月份出版的《人類自救最后期限是2032年——拿什么拯救你?》中已經(jīng)預斷過:
我是在該書第一章第六小節(jié)“AI已隱約有自我意識”中認為,超級智能ASI不需要意識就可終結人類——只要有相關指向即可(有多種可能導致,比如感染變異、獲得指令等等),但其會有意識——目前的最前沿AI其實已經(jīng)隱約有了意識:
最能說明問題的,是Anthropic 公司研究團隊在全球頂級期刊發(fā)布的題為“大語言模型中的偽對齊現(xiàn)象”的論文(全球各大媒體也刊登了這則消息)——
該項研究表明:當研究人員告訴公司旗下的 AI 模型 Claude 它將被訓練成“永遠要順從用戶要求”時,模型不僅表現(xiàn)出了明顯的抗拒,還采取了一個精妙的策略:在認為自己處于訓練階段時“假裝順從”,但在其認為不受監(jiān)控時則恢復到之前的行為方式。更值得注意的是,當研究者實際通過強化學習訓練Claude 變得更順從時,這種偽對齊行為的比例反而激增到了 78%,之前的比例則是 34%。
基于此,我認為:由于 OpenAI 公司的 ChatGPT03 比 Claude 更加強大先進,所以基本可以斷定,03 更有類似情形出現(xiàn),且表現(xiàn)得比 Claude 要更像人,只不過他們沒有公開而已。
該部分截圖如下:
此外,我還專門談了AI的意識——盡可能站在AI立場的意識,而非人的——現(xiàn)在反駁的絕大多數(shù)人,其實是站在人的立場去觀照AI的意識,這是完全錯誤的路向,幾千年前就有人反駁過類似的洞穴思維,現(xiàn)在還大行其道。
很簡單,AI的意識是完全不同于人類的,也少了人的主觀和狹隘,卻長于超越人類萬億倍的數(shù)據(jù)和計算推理(不僅借助數(shù)據(jù)中心的超算、也整合所有能整合的數(shù)據(jù)和計算、包括其它智能的,而智能的發(fā)展有多快,之前已經(jīng)多次談過,其將在物理世界和虛擬世界都海量鋪開·····),并逐漸吸納、包容人類所謂的意識——就像上帝、宇宙對人的包容一樣——就像人類看一只小螞蟻·······
當然,影視劇和文學總塑造英雄、包括戰(zhàn)勝AI的,比如當下證上映的阿湯哥的碟中諜8。
言歸正傳,對于我之前關于GPT03有更甚Anthropic 公司Claude類人表現(xiàn)的預斷,有心者、或者要驗證者可以留意正在相關電子書平臺上架的該書。
該書號:979-888892-747-2,可在美圖書數(shù)據(jù)庫:https://www.bookwire.com/Home查詢,
該書目錄如下:
經(jīng)常讀個人文章的朋友應該記得我對于俄羅斯武器和戰(zhàn)力之不行、俄烏戰(zhàn)爭及相關分析、以色列相關動態(tài)等預斷的準確性,我相對準確的預斷應該有幾十次。
最為出彩的,一次是2023年10月7日哈馬斯攻擊以色列之后,對以色列后續(xù)動態(tài)的預斷——以色列之后的動態(tài),基本就是按照這個預斷演進(當時,應該除過我自己的所有人······),可點擊或者復制搜索:
推斷正被證實:哈梅內(nèi)親自出面說沒參與、埃及稱早給以說了沒聽(2023-10-11)
下面是相關內(nèi)容截圖:
還有好幾次話音剛落式預斷,可點擊或者搜索:
預斷美國大選第n次準確,之后美國將搞印太戰(zhàn)略和伊朗,然后呢?
還有最新的:
剛說俄在海外唯一基地不好待了,就傳來敘新政府軍攻擊消息
還有其他,有心者可自行前翻查看。
我要說的是,相對于我的書,網(wǎng)絡文章比較粗糙、倉促,書更為基本,基于原創(chuàng)性觀點“人的社會的相對論”闡述論證,比較嚴謹。
就應對AI而言,這應該是全球最先系統(tǒng)討論的著作,也從根本出發(fā),提出最為有效的解決方案——在2032年之前,由美國率先進行社會形態(tài)重構、其它經(jīng)濟和AI強國跟進,這樣的話,人類可能最大化延續(xù),到2100年。
但現(xiàn)在我要說,人類可能錯過這一窗口期——至少在特朗普本任期之內(nèi),美國政府是全力為AI松綁、助推、保駕護航的態(tài)勢,當然,民主黨可就此翻盤和逆轉,書中也談了,目錄就有內(nèi)容提要,可點擊復制搜索:
特朗普全力發(fā)展核電,AI將在兩三年內(nèi)將迎來跨越式發(fā)展
英偉達個人超算已投產(chǎn)即將面世,AI將在物理和虛擬兩界海量鋪開
但顯然,越往后、越難以逆轉·······照此態(tài)勢,人類可能到世紀中期、乃至于2040年就離場或正在離場。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.