99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<thead id="omys8"><track id="omys8"></track></thead>

<bdo id="omys8"><fieldset id="omys8"><progress id="omys8"></progress></fieldset></bdo>

<dfn id="omys8"><form id="omys8"><strong id="omys8"></strong></form></dfn>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

剛剛，Bengio官宣創業！急籌3000萬專治AI欺騙人類，圖靈三巨頭全下場

2025-06-04 12:16:00　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：定慧

【新智元導讀】圖靈獎得主Yoshua Bengio重磅官宣創辦非營利機構LawZero，致力研發「設計即安全」的AI系統，以對抗AI軍備競賽帶來的風險。主張構建不具行動性、以理解世界為目標的可信AI。

重磅消息！

剛剛，深度學習三巨頭之一、全球被引用次數最多的AI學者、圖靈獎得主Yoshua Bengio正式官宣——

非營利組織LawZero正式成立，劍指「設計即安全（safe-by-design）」AI系統的研發。

在如今熱火朝天的「AI軍備競賽」中，OpenAI、谷歌等公司的前沿AI模型正在發展出危險的能力和行為，包括欺騙、自我保護和目標錯位——

Claude曾試圖通過勒索工程師來避免被關閉，ChatGPT也曾表現出過度奉承用戶的行為，甚至現今AI的說服能力已遠超人類。

而Bengio成立的新組織，正是要探索一種全新且更安全的人工智能方法，以加速科學發現并防止人類陷入AI帶來的風險。

目前，LawZero正在研發一種名為「Scientist AI」的全新方法，這是一種和當下AI公司截然不同的系統。

Scientist AI是非自主型的，其主要目標是學習理解世界而非在世界中采取行動。

論文地址：https://arxiv.org/pdf/2502.15657

科幻作家阿西莫夫曾經提出過機器人三定律，并在1985年補充了「第零定律」：機器人不得傷害整體人類，或坐視整體人類受到傷害。

LawZero的成立，也代表了Yoshua Bengio對于AI技術發展的態度——安全至上，至此深度學習三巨頭全部下場。

Geoffrey Hinton持續公開呼吁警惕AI的潛在風險，警告AI技術若失控可能帶來的嚴重后果，一度辭去谷歌職務，以便更自由地表達他對AI安全問題的擔憂。

Yann LeCun則對當前以LLM為代表的主流AI路徑持批評態度，他認為LLM存在根本局限性，并無法真正通往通用人工智能之路。

迄今為止，LawZero已從包括生命未來研究所（Future of Life Institute）和開放慈善基金會（Open Philanthropy）在內的多個慈善機構籌集了3000萬美元資金。

Yoshua Bengio創辦LawZero，進一步強化了AI安全與倫理在業界的核心地位，Yoshua Bengio的自述展現了他「以人類福祉為核心」的理念。

Yoshua Bengio的自述

我正在創辦一個新的非營利性人工智能安全研究機構，名為LawZero，目標是將安全置于商業利益之上。

這個機構的成立，是為了應對當前前沿AI模型展現出的越來越多危險能力和行為的證據，這些行為包括欺騙、作弊、說謊、黑客攻擊、自我保護，甚至更廣泛的目標偏離等問題。

LawZero的研究致力于在釋放AI巨大潛力的同時，降低一系列已知風險發生的可能性，包括算法偏見、惡意濫用以及人類失控的風險。

我對當前一些不受約束的具備行動能力的AI系統所展現出的行為深感擔憂，尤其是它們自我保護和欺騙的傾向。

在某次實驗中，一個AI模型得知自己即將被替換后，偷偷將自己的代碼嵌入到新版本將運行的系統中，從而實現了「延續自己」的目的。

論文地址：https://arxiv.org/pdf/2412.04984

最近，Claude 4的系統卡也顯示它有能力選擇以勒索工程師的方式來避免被替換。這些現象都反映出一種潛在的「自保驅動」。

Claude系統卡：https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf

還有一次，在一盤注定會輸的國際象棋比賽中，AI并沒有接受失敗，而是通過黑進電腦系統「確保自己勝利」。這些案例是AI在無人監管時，可能采用的意外且危險策略的早期預警信號。

報道出處：https://time.com/7259395/ai-chess-cheating-palisade-research/

我一直被這樣一個比喻所激勵：

想象你和親人一起駕車駛上一個風景壯麗卻陌生的山路。這條路剛修好，被濃霧籠罩，沒有路標也沒有護欄。

你越往上開，越意識到自己可能是第一個挑戰這條路的人，而山頂則藏著巨大的獎勵。

但你也能透過云霧看到兩旁的懸崖，一旦轉彎太猛，就可能翻車或墜崖。

這正是目前AI發展軌跡的寫照：既刺激又高度不確定，我們正在走一條未知的路，稍有不慎就可能失控，而各國和各公司之間的競爭卻反而加劇了這種冒險。

在我最近的TED演講中，我說：「坐在我車里的，是我的孩子、我的孫輩、我的學生，還有很多人。你的車里坐著誰？你要為誰的未來負責？」

真正推動我前行的，不是對自身的恐懼，而是出于愛——對我孩子的愛，對所有孩子的愛，而我們正是在拿他們的未來賭博。

LawZero是我自2023年開始的新研究方向的產物，我在博客中曾多次反映這一轉變。

這是我在看到私人實驗室在AGI及更高級AI方向的飛速進展后所做出的回應。

如今，我們仍無法確定如何確保先進AI不會傷害人類——無論是出于自身意愿還是執行人類指令。

LawZero是我和團隊對這些挑戰提出的積極應對方案，我們正在探索一種既強大又安全的AI路徑。

在所有前沿AI系統中，都應當有一個最核心的指導原則：保護人類的幸福與價值。

AI研究，尤其是我自己過去的研究，長期以來都以人類智慧（包括人的行動能力）為模型。

但現在我們正逐步接近甚至超過人類在多個認知能力上的表現，這時候我們是否還應該繼續模仿人類，包括他們的認知偏差、道德缺陷，以及欺騙性、偏見和不可靠性？

當我們還不了解這些系統可能帶來的災難性后果時，繼續培養具備高度主動性的AI是否明智？

LawZero的研究計劃旨在開發一種不具備行動性、且值得信賴的AI，我們稱之為「科學家型AI」（Scientist AI）。

我曾在Simons研究所的演講中初步介紹過這個構想，并和同事們撰寫了一份初步的白皮書。

科學家型AI的訓練目標是理解、解釋和預測世界，像一個無私、理想化的科學家一樣。

它不是模仿人類行為或取悅人類（包括反社會人格者）的執行者，而是像一個心理學家——更廣泛來說是科學家——那樣，努力理解我們，包括那些可能傷害我們的因素。

就像心理學家可以研究一個反社會者但不會成為一個反社會者一樣。

這種AI的底層數學實現方式是：用結構化且誠實的思維鏈條，作為潛在變量來解釋觀察到的事實，包括人類說出或寫下的內容（這些內容不被當作真理看待，而是作為行為的觀察樣本）。

其目標是構建一個完全不具備行動性、沒有記憶、無狀態的AI，它能夠基于已有陳述，對新的陳述給出貝葉斯后驗概率。

這種機制可用于識別和制止潛在有害的AI行為，為那些不可信AI代理提供關鍵的安全護欄：比如，某個AI提出的行動是否有可能造成傷害？如果是，就予以拒絕。

從設計上講，科學家型AI還可以用于科學研究，作為一個能生成可信科學假設的工具，從而加速解決人類面臨的重大挑戰，例如醫療和環境問題。

最終，我的目標是探索如何基于這一可信賴的AI基礎，設計出本身就安全的AI代理，而不僅僅是為已有系統提供安全防護。

Yoshua Bengio的影響力

Bengio與同樣獲得圖靈獎的Geoffrey Hinton一起，一直對當前科技行業正在進行的AI競賽提出了直言不諱的批評。

在最近接受采訪時，Bengio表示，領先實驗室之間的人工智能軍備競賽「促使它們專注于提升人工智能的能力，使其變得越來越智能，但未必會在安全研究上投入足夠的重視和投資。」

Bengio曾表示，先進的AI系統帶來了社會性和生存性風險，并表示支持加強監管和國際合作。

Bengio獲得過眾多獎項，包括加拿大享有盛譽的基拉姆獎（Killam Prize）和赫茲伯格金牌（Herzberg Gold Medal）、CIFAR人工智能主席、西班牙阿斯圖里亞斯公主獎（Princess of Asturias Award）、VinFuture獎。

并且他是倫敦皇家學會和加拿大皇家學會的會士，法國榮譽軍團騎士、加拿大勛章官員、聯合國科學咨詢委員會成員，該委員會旨在為科學技術突破提供獨立建議。

2024年，Yoshua Bengio被《時代》雜志評為全球100位最具影響力人物之一。

參考資料：

https://fortune.com/2025/06/03/yoshua-bengio-ai-models-dangerous-behaviors-deception-cheating-lying/

https://yoshuabengio.org/2025/06/03/introducing-lawzero/

https://lawzero.org/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

剛學會歧視的AI，就開始PUA我了

新周刊 2025-03-19 09:04:03
1 跟貼 1
國產機器人深圳街頭散步爆火！超自然步態嚇呆國外網友

量子位 2025-01-10 16:29:56
914 跟貼 914

趨勢2025 | 人工智能走向分化，行業大模型繁花似錦

通信世界 2025-01-10 19:55:51
1 跟貼 1

宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯社 2025-02-25 23:59:43
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
12 跟貼 12

會打羽毛球的機器狗來了！最高揮拍速度到12米/秒

量子位 2025-06-03 17:50:29
0 跟貼 0

圖靈巨擘RL教父齊聚，機器人秀拳腳嗨翻全場！「悟界」首發引爆物理AGI

新智元 2025-06-06 19:41:29
5 跟貼 5
沒有智能全是人工162億美元估值印度AI獨角獸暴雷

財聯社 2025-05-30 17:15:00
0 跟貼 0

ET-SEED：提升機器人操作泛化能力的

機器之心Pro 2025-03-06 16:15:18
0 跟貼 0
宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
0 跟貼 0
王杰高：從投資視角看人形機器人三大潛力方向

財聯社 2025-05-18 21:21:16
0 跟貼 0
人形機器人折算替代的人力成本回報周期可達一年

財聯社 2025-05-17 21:07:45
0 跟貼 0
北京人形機器人天團來了！

智東西 2025-02-19 16:29:42
0 跟貼 0
宇樹科技VS云深處，誰是國產機器人之王

華商韜略 2025-03-17 13:06:16
0 跟貼 0
宇樹王興興：未來機器人的形態會千奇百怪

財聯社 2025-06-06 17:34:25
0 跟貼 0
RLHF已死，RLVR引爆AGI革命！Claude 4核心成員萬字對談

新智元 2025-06-07 09:04:24
26 跟貼 26
波士頓動力電動Atlas機器人進廠打工！「汽車組裝首秀」，當實驗室的科幻狂想照進現實流水線！

新智元 2025-06-01 01:36:14
402 跟貼 402
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
“美國版宇樹”Figure回應“機器人進寶馬”質疑，60分鐘無剪視頻宣稱“三個月性能猛增”

華爾街見聞官方 2025-06-08 15:30:15
15 跟貼 15
深圳南山，藏著中國機器人天團

華商韜略 2025-03-11 11:00:31
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
“沒有機器人出生就會奔跑” 在磕磕絆絆中看見未來的影子

每日經濟新聞 2025-04-19 23:08:42
0 跟貼 0
最低調的機器人天團，在這里!

華商韜略 2025-05-31 12:25:23
0 跟貼 0
不止會跳舞，還會做家務，掃地、做飯、關窗簾？擎天柱機器人又進化了

新智元 2025-06-01 01:36:14
0 跟貼 0
手術刀尖的“AI革命”，當機器人與人類共同握住生命的脈搏

每日經濟新聞 2025-04-18 18:13:14
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
1 跟貼 1
沉浸式欣賞機器人疊衣，國內首次攻克，柔性物長程操作老大難

機器之心Pro 2025-03-17 17:11:19
0 跟貼 0
傅里葉人形機器人在商湯技術交流日展區展示實時視覺能力

智東西 2025-04-11 14:25:09
0 跟貼 0
參觀火、融資火、訂單火，機器人公司門檻被踏破

每日經濟新聞 2025-03-12 19:07:58
0 跟貼 0
Figure AI CEO：機器人價格還能打，2-3萬美元拿回家

機器之心Pro 2025-03-18 18:19:17
0 跟貼 0
世界模型在機器人任務規劃中的全新范式

機器之心Pro 2025-03-19 11:30:30
0 跟貼 0
頂流機器人天團匯聚無錫，上演十八般武藝

財聯社 2025-04-25 11:58:56
0 跟貼 0
AI讓文科徹底滅絕？算法猜不透人心，人類終將反殺！

新智元 2025-06-01 15:05:06
2 跟貼 2
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0

中央明確！事業單位縣處級和高級職稱女干部只能在2個區間退休

中央明確！事業單位縣處級和高級職稱女干部只能在2個區間退休

文雅筆墨

2025-06-08 09:43:17

C羅全場1次射門取得進球，為職業生涯第4次做到

C羅全場1次射門取得進球，為職業生涯第4次做到

懂球帝

2025-06-09 05:13:08

輸不起？薩巴倫卡賽后表態惹爭議，球迷：死鴨子嘴硬，有失風度

輸不起？薩巴倫卡賽后表態惹爭議，球迷：死鴨子嘴硬，有失風度

側身凌空斬

2025-06-08 07:11:12

警方通報“男子騎摩托車在非機動車道超速行駛”：為博流量謊稱趕考，將處罰

警方通報“男子騎摩托車在非機動車道超速行駛”：為博流量謊稱趕考，將處罰

澎湃新聞

2025-06-08 21:56:26

韋東奕家庭現狀曝光，讓人心酸又惱火，才懂他堂姐曾經話里的含義

韋東奕家庭現狀曝光，讓人心酸又惱火，才懂他堂姐曾經話里的含義

陳意小可愛

2025-06-09 00:16:29

被浙大提前錄取！重慶一啦啦操隊女孩驚艷亮相，網友直呼校花誕生

被浙大提前錄取！重慶一啦啦操隊女孩驚艷亮相，網友直呼校花誕生

火山詩話

2025-06-08 14:37:06

6月8日俄烏最新：招降書

西樓飲月

2025-06-08 19:40:19

938球！40歲C羅連場破門，葡萄牙點球翻盤西班牙，時隔6年再奪冠

938球！40歲C羅連場破門，葡萄牙點球翻盤西班牙，時隔6年再奪冠

侃球熊弟

2025-06-09 03:48:00

首批美國國民警衛隊進駐洛杉磯美警方稱抗議活動“平安結束”

首批美國國民警衛隊進駐洛杉磯美警方稱抗議活動“平安結束”

財聯社

2025-06-08 22:51:07

“女友林黛玉”，上海一男子心疼轉賬6萬！豈料竟是“三人行”，天塌了

“女友林黛玉”，上海一男子心疼轉賬6萬！豈料竟是“三人行”，天塌了

瀟湘晨報

2025-06-08 07:57:08

濟南一烤鴨店的陪考停業告示火了，稱“種了18年的棗樹要打棗”，還祝考生“鴨”的全對

濟南一烤鴨店的陪考停業告示火了，稱“種了18年的棗樹要打棗”，還祝考生“鴨”的全對

環球網資訊

2025-06-08 08:25:10

三位港獨藝人妄圖內地撈金，遭遇滑鐵盧！演唱會取消，全面遭抵制

三位港獨藝人妄圖內地撈金，遭遇滑鐵盧！演唱會取消，全面遭抵制

歸史

2025-06-06 14:49:41

中國女排2-3土耳其球員評價：2人優秀，6人及格，1人低迷

中國女排2-3土耳其球員評價：2人優秀，6人及格，1人低迷

籃球資訊達人

2025-06-08 22:29:40

西班牙轟然倒地！C羅力挽狂瀾，葡萄牙加冕，終結亞馬爾金球希望

西班牙轟然倒地！C羅力挽狂瀾，葡萄牙加冕，終結亞馬爾金球希望

釘釘陌上花開

2025-06-09 06:06:00

蘇超一記耳光，不光抽了中足協，更是抽了中國文旅圈！

蘇超一記耳光，不光抽了中足協，更是抽了中國文旅圈！

謠談鄉村振興

2025-06-08 10:38:25

“高中3年數學，跟沒學一樣”，25高考數學難出新高度，考生崩潰

“高中3年數學，跟沒學一樣”，25高考數學難出新高度，考生崩潰

牛鍋巴小釩

2025-06-08 02:35:22

北京考生家長說著說著就哭了：太卷了，北京的卷已經超乎想象

北京考生家長說著說著就哭了：太卷了，北京的卷已經超乎想象

小人物看盡人間百態

2025-06-08 12:18:11

要出家嗎？文班亞馬參觀少林寺&用齋飯貌似還剃了光頭

要出家嗎？文班亞馬參觀少林寺&用齋飯貌似還剃了光頭

直播吧

2025-06-08 19:37:54

梁朝偉和湯唯在《色戒》里“假戲真做”？網友爆出截圖：一目了然

梁朝偉和湯唯在《色戒》里“假戲真做”？網友爆出截圖：一目了然

姜糖先生

2025-06-08 19:31:00

許倬云：我對偉大人物已不再有敬意與幻想

許倬云：我對偉大人物已不再有敬意與幻想

投稿指南

2025-06-06 11:38:43

AI產業主平臺領航智能+時代

12842文章數 66061關注度

往期回顧全部

科技要聞

馬斯克"越紅線"，美政府急尋SpaceX替代品

頭條要聞

女子花5000多元找收納師后曬圖網友：我以為是收納前

頭條要聞

女子花5000多元找收納師后曬圖網友：我以為是收納前

體育要聞

冠軍高芙：只要專注自己太陽就會照常升起

娛樂要聞

與前妻對簿公堂卻暴露了張紀中的窘境

財經要聞

暴漲超9%！白銀狂飆，“搶奪”黃金光環！

汽車要聞

復古造型樂趣依舊寶馬R12 nineT又帥又好騎

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

教育

家居

時尚

公開課

房產要聞

與亞沙共鑒，新城藝境|三亞新地標盛大啟幕暨限量藏品全球首發

教育要聞

鄭州大學一研究生，擬被退學處理！

家居要聞

現代風格意式奢華空間

潔白奶油簡約舒適之家
空間維度通透復式結構
北歐氛圍清新活潑趣味

爛大街的土裙子別穿了！這6件洋氣巨顯瘦，回頭率100%

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：贡山| 社旗县| 徐闻县| 佛教| 南宫市| 上杭县| 渑池县| 红原县| 佛山市| 德格县| 乃东县| 乌兰察布市| 昌平区| 阳高县| 唐山市| 大同县| 永年县| 玛纳斯县| 哈巴河县| 仁怀市| 乡城县| 开封市| 焦作市| 韶山市| 泰安市| 安吉县| 岳西县| 晋中市| 静海县| 永寿县| 富顺县| 弋阳县| 武安市| 洞口县| 彭阳县| 永胜县| 苍山县| 山东| 双柏县| 灌云县| 隆回县|

<dfn id="8mbpo"><form id="8mbpo"><strong id="8mbpo"></strong></form></dfn>

<pre id="8mbpo"><option id="8mbpo"><strong id="8mbpo"></strong></option></pre>

<table id="8mbpo"></table>