99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<p id="xb82h"><li id="xb82h"><pre id="xb82h"></pre></li></p>

<cite id="xb82h"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Ilya塵封10年錄音曝光！大二入Hinton門下，竟坦言機器學習反直覺

2025-07-04 08:34:23　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：定慧

【新智元導讀】即便在Transformer與ChatGPT尚未誕生的年代，Ilya已敏銳預見深度學習的廣闊前景，展現出令人嘆服的遠見與清醒。這是一段10年前Ilya對于如今AI時代的預言。

Ilya Sutskever因在深度學習方面的遠見卓識而聞名。

他現在許多廣為流傳的言論其實都來自于他在2023年參加Dwarkesh播客時的發言。

此后，直到2025年Ilya創辦SSI后，幾乎不再有公開的言論，此前曾探討過Ilya的去向。

最近，一位名為Nathan Lambert的博主聲稱他收到了一段Ilya在10年前，也就是2015年談論深度學習的語音片段。

令他感到震驚的是，Ilya在那么多年前就已準確預見了這一切，尤其是他的直覺從那時至今幾乎沒有任何改變。

在進行資料整理，同樣震驚我們的是：

早在2015年，Ilya對于深度學習的理解就已經遠超如今絕大部分人（即使是10年后今天）。

這個視頻片段來自一個已經停播的博客節目《Talking Machines》，我們在其官網找到最初的采訪錄音。

此時的Ilya還是谷歌的研究員，節目中談論了他的工作、他是如何對機器學習產生興趣的，以及為何機器學習（Machine Learning）會和魔法思維（Magical Thinking）產生聯系。

現在就讓我們將時間回撥10年，看看當年的Ilya是如何洞察深度學習的。

在編輯這篇文章時，我們也驚訝地發現，即使只是通過文字記錄，Ilya的觀點歷經10年歲月洗禮，依然鮮明犀利。

數學出身的Ilya，認為「機器學習」違反直覺

Ilya首先講述了他通往人工智能的道路，對于這樣一位才華橫溢的人物來說，這并不令人意外。

我十幾歲時就一直對人工智能感興趣。

我覺得那非常棒而且引人入勝。之后我繼續攻讀了數學專業本科。

當你學習數學的時候，你會深知數學注重的是證明事物。

如果你看到某種規律，在沒有經過證明之前，它并不意味著就是正確的。

因此，對于擁有數學背景的我來說，學習（機器學習）似乎是非常違反直覺的，因為學習強調的是進行歸納推理，而這些歸納步驟看起來很難用嚴謹的方法去解釋清楚。

如果你習慣于嚴格地證明結果，那么歸納似乎幾乎就像魔法一樣。

因此，我當時對學習特別感興趣，因為我深知人類具備這種能力，而從單純的數學角度來看，學習似乎根本不可能實現，這讓我感到不可思議。

大二和Hinton合作

于是我開始四處尋找，結果發現多倫多有一個非常出色且強大的學習研究團隊。

我在本科二年級時便開始與Jeff Hinton（AI之父）合作。

相比硬科學，機器學習的理解更加容易

機器學習確實是一門復雜的科學。

我想這不像物理學。

我認為在物理學、數學以及許多其他硬科學領域，一個人需要掌握大量知識后才能開始發揮作用。

雖然我不太確定，因為我從未涉足這些領域。

這只是我的印象。

而機器學習則更多地是，那些重要的想法，甚至是與前沿研究相關的想法，都離表面非常近。

這個觀點和我們如今的現狀是如此的吻合。

尤其是在一個遠離真正訓練前沿的實驗室中，在沒有特別努力尋找的情況下，周圍的機器學習的低垂果實之多令人驚訝。

深度學習之所以有效，很大程度上是因為人們愿意付出努力去把握這些機會。

Ilya認為：

只要有正確的指導和方向，無需多年學習就能理解機器學習背后的主要思想、有效方法的主要理念以及主要的直覺認識。

監督學習是機器學習中最成功的領域

Ilya在訪談中談到，到目前為止（2015年），監督學習是機器學習中最成功的領域。

主持人隨后請Ilya解釋他最近的工作，Ilya繼續深入講解了深度學習如何得出答案的另一個核心要點。

所以你說，好，數據會告訴我們最佳的連接方式。

因為深度神經網絡是一種非常強大、非常豐富的模型，它可以完成很多復雜的任務。

我們很難想象它有哪些事情是無法做到的。

正因如此，每當我們擁有大型數據集時，我們可以應用一種簡單的學習算法來找到最佳的神經網絡，并取得良好的結果。

因此，我當時致力于將深度監督學習方法應用于神經網絡，解決輸入是序列、輸出也是序列的問題。

從概念上講，這與我之前所討論的內容并沒有實質差別，主要是一個技術問題。

其關鍵在于確保模型能夠處理輸入和輸出都是長度不再預先固定的序列。

但它的基本方法是一樣的，并且使用了相同的基本學習算法。

因此，再次強調，由于這些模型具有很強的表達能力和功能，它們確實能夠解決許多困難的、非平凡的模式識別問題，以及用其他任何手段幾乎無法想象能解決的問題。

再者，令人驚訝的是，盡管這種方法最終表現得如此強大，它實際上卻非常簡單易懂。

學習算法極其簡單。也許只需要一個小時，一個聰明的學生就能理解它全部的工作原理。

這個觀點也和我們當下的現狀極度吻合。

不論是LLM還是Transformer，我們都可以在簡單學習后，了解它的基本原理。

甚至就像2023年那次采訪的題目，為何「預測下一個單詞」這么簡單的模型就能超越人類的智能。

只是為了增加數據

在Ilya看來，將深度學習中成功的圖像分類技術應用到序列分類（即更接近文本）上只是「一個技術細節」。

人們所做的很多工作更像是在為模型構建數據加載器，而不是我們提出的架構本身有多新穎。

Ilya如此注重數據和通用性，那么后來像Transformer這樣的架構席卷整個機器學習領域也許并不會讓他感到意外。

神經網絡的目標函數非常復雜

它高度非凸。

而且從數學上完全沒有任何保證能確保優化成功。

因此，如果你和一位研究優化理論的學者討論，他們會告訴你，從理論上根本沒有理由相信這種優化會奏效。

然而，事實證明它確實能成功——這是經驗證明的結果。

純粹靠理論，我們很難解釋太多細節。

并不是因為這里有什么「魔法」，而只是說明我們還沒完全搞清楚原理。

我們其實不清楚，為什么這些看似簡單的啟發式優化算法在這些問題上表現得如此出色。

因為沒有任何數學定理或理論可以說明它們必然會成功。

我們真正期待的定理，應該反映「在現有條件下做到最好」這種理念。

然而，人類的智慧并不追求絕對最優，就像我們設計飛機或汽車時也不會力求完美。

我們只需要一個「夠好」的工程系統就行。

深度學習和非凸優化給我們的，正是一群「夠好」的系統。雖然它們可能不是最優解，卻依然非常有用、充滿潛力。

這就是事實。

深度學習追求的是「夠好」

在許多領域，尤其是學術界，人們過度追求最優，反而忽略了真正重要的目標。

深度學習是一門務實的科學，它在現有資源條件下追求「夠好」。

隨著數據量和算力的飛速增長，「夠好」往往就能帶來驚人的成果。

這種「夠好」的思路，也讓現代人工智能更像「煉金術」而非傳統科學.

因為傳統科學的進展通常要慢得多。

也許正是這種因為深度學習是務實的，在如今算力爆炸和數據豐富的時代，LLM雖然還是「黑箱」，但已經切實的改變了我們的工作和生活。

某種意義上，也算「預言」了整個LLM時代。

初始化的尺度直接決定了模型的可訓性

關于這一點，還有一些不那么直觀但非常重要的細節值得討論。

你可以這樣理解：神經網絡里有大量神經元和連接，每層都會先將輸入乘以隨機權重，再經過非線性變換。

第一層處理完后，第二層又會重復相同的過程：乘權重、做非線性變換。

如果這些隨機權重太小，信號在多次相乘后就會迅速衰減到幾乎為零。

當信號到達輸出層時，你幾乎感受不到任何輸入的影響。

這樣一來，學習算法就無法發現輸入和輸出之間的關聯，也就沒法改進模型。

因此，我們必須讓隨機初始化的權重大多數情況下足夠大，才能保證輸入的變化一路傳遞到輸出層。

一旦滿足了這個條件，梯度就能夠找到正確的方向，有效地優化網絡。

…因此在實際應用中，當研究人員希望在一個真實數據集上訓練神經網絡時，初始化的尺度是你需要關注的最重要的參數之一。

以上內容節選自音頻對話內容，絕大部分來源于Ilya本人。

這就是Ilya 2015年對機器學習的深刻洞察。

那時，距離Transformer發布還有4年，距離ChatGPT發布還有7年的時間。

但是Ilya已經深刻地體會到神經網絡的威力。

如果你想要更加深入的了解，可以詳細聽聽上面的音頻。

最后想說的是，Ilya對于這場改變我們所有人的科技革命的直覺。就來自于在這次訪談中他想要告訴我們的：追求務實，擁抱簡單。

參考資料：

https://feeds.acast.com/public/shows/talking-machines

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

剛學會歧視的AI，就開始PUA我了

新周刊 2025-03-19 09:04:03
1 跟貼 1
李飛飛萬字訪談：空間智能是 AI 的下一個前沿領域

愛范兒 2025-07-04 16:27:24
0 跟貼 0

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0

大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0

AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
1 跟貼 1

研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
DeepSeek降本秘訣曝光：2招極致壓榨推理部署，算力全留給內部

量子位 2025-07-04 15:29:16
0 跟貼 0
人機協同篩出2600萬條數據,七項基準SOTA,昆侖萬維獎勵模型新突破

機器之心Pro 2025-07-04 10:55:11
0 跟貼 0
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
清華Nature論文顛覆認知，揭示共享神經動態或成智能體通用法則

DeepTech深科技 2025-07-03 16:28:25
1 跟貼 1
ESG信披案例 | “人工智能”出現超110次高級副總裁喬健解讀聯想集團ESG報告：AI創造了解決社會問題的創新方案

每日經濟新聞 2025-07-03 19:56:05
0 跟貼 0
新天終啟，萬象智生——萬年奇點時刻，誰將引爆中國ASI？

新智元 2025-07-04 13:27:39
0 跟貼 0
AI云端P圖？榮耀用算法實現“影像平權”，要AI還是真實？

雷科技 2025-07-04 15:24:00
0 跟貼 0
中美AI差距有多大，AI競爭焦點在哪？《全球人工智能科研態勢報告》全球首發

鈦媒體APP 2025-07-03 18:35:06
0 跟貼 0
Agent RL與智能體進化關鍵一步：TaskCraft實現復雜任務自動生成

機器之心Pro 2025-07-04 13:05:41
0 跟貼 0
剛剛，Ilya被逼當CEO，聯合創始人都被Meta挖跑了

智東西 2025-07-04 12:58:13
0 跟貼 0
14%論文都有AI代寫？Nature：每7篇就有1篇藏有ChatGPT特征詞

量子位 2025-07-04 15:49:13
0 跟貼 0
洪森權謀曝光！捅刀老友他信+錄音設局，泰國政壇大地震

評論員何亮亮 2025-07-03 18:20:30
2 跟貼 2
智能電視網絡安全的深度學習監測研究

通信世界 2025-07-01 15:20:03
0 跟貼 0
首個GUI多模態大模型智能體可信評測框架+基準：MLA-Trust

機器之心Pro 2025-07-04 11:24:22
0 跟貼 0
用物理學改進深度學習，AI大模型的新突破

量子位 2025-05-05 13:12:31
0 跟貼 0
吳曉波：你的第一本“大模型”書長什么樣？

吳曉波頻道 2025-06-18 08:33:57
0 跟貼 0
馬斯克已對火星失去信心，星際殖民是替AI開路

盧菁老師 2025-07-02 14:34:35
0 跟貼 0
程序員運氣太背了！從入職開始接到的項目都在能力之外！

程序員古耕 2025-07-04 15:31:53
0 跟貼 0
首次，用自然語言解釋圖神經網絡 | ACL 2025

新智元 2025-07-04 13:27:21
0 跟貼 0
佩通坦錄音事件引爆泰國輿論，皇室敏感話題再掀波瀾

舉頭月已燕歸來 2025-07-03 15:27:48
0 跟貼 0
所以說智商越高的人對社會危害越大

拖鞋追劇 2025-06-30 17:38:56
0 跟貼 0
AI產品經理需要哪些素質- 神仙崗平民化！AI產品經理0基礎入局指南 #AI產品經理 #職業風口 #

盧菁老師 2025-07-03 13:13:17
0 跟貼 0
錄音泄露第13天，佩通坦被迫交權，洪森一語成讖？輸家已經浮現

犀牛老師觀點 2025-07-03 18:35:36
0 跟貼 0
烏方"紅軍村"被俄軍集11萬兵力猛攻俄方戰報泄露天機

上觀新聞 2025-07-04 01:40:08
7975 跟貼 7975
這里是美國足球比賽現場，大叔拿著油鋸切割木頭很是奇怪，知識

米樂米兜的麻麻 2025-06-30 07:27:13
12 跟貼 12

游本昌宣誓入黨，人民文藝的信仰燈塔

游本昌宣誓入黨，人民文藝的信仰燈塔

文匯報

2025-07-03 20:44:08

51票通過，特朗普訪華名單生變，馬斯克看不了閱兵，中美有新情況

51票通過，特朗普訪華名單生變，馬斯克看不了閱兵，中美有新情況

吳欣純Deborah

2025-07-03 10:23:23

中方已正式對李在明發出93閱兵邀請？他親自回了9個字，左右為難

中方已正式對李在明發出93閱兵邀請？他親自回了9個字，左右為難

回京歷史夢

2025-07-04 15:47:16

9·3大閱兵中又多了一款機型，殲20A修形版現身

9·3大閱兵中又多了一款機型，殲20A修形版現身

三叔的裝備空間

2025-07-04 12:56:02

上海核心地標突發！全禿了！11棵稀缺景觀資源被毀，恢復要20-30年，檢察機關出手

上海核心地標突發！全禿了！11棵稀缺景觀資源被毀，恢復要20-30年，檢察機關出手

上觀新聞

2025-07-04 12:22:13

民間“三大缺德事”，件件喪盡天良，如今仍然有人在做

民間“三大缺德事”，件件喪盡天良，如今仍然有人在做

牛鍋巴小釩

2025-06-27 15:29:29

埃及媒體：由于若塔去世，薩拉赫將縮短假期于周五返回英格蘭

埃及媒體：由于若塔去世，薩拉赫將縮短假期于周五返回英格蘭

懂球帝

2025-07-03 22:28:01

泰王出手強力支持佩通坦，洪森陰謀破敗，淪為東南亞的歷史笑柄

泰王出手強力支持佩通坦，洪森陰謀破敗，淪為東南亞的歷史笑柄

大道無形我有型

2025-07-03 20:59:43

賣了11年，它又重新上市了

新車評網

2025-07-03 16:16:28

MacMahon：邁克-布朗壓力會很大因為尼克斯若沒進總決賽就是失敗

MacMahon：邁克-布朗壓力會很大因為尼克斯若沒進總決賽就是失敗

直播吧

2025-07-04 16:21:39

中央5臺今晚直播U16國足迎戰日本隊時間表！附7月4日CCTV5節目單

中央5臺今晚直播U16國足迎戰日本隊時間表！附7月4日CCTV5節目單

皮皮觀天下

2025-07-04 04:54:00

兩性關系：男人年齡過了60歲，大部分男性都會出現哪種狀況？

兩性關系：男人年齡過了60歲，大部分男性都會出現哪種狀況？

伊人河畔

2025-06-30 22:29:45

首富貝索斯婚宴后，卡戴珊姐妹歐洲狂歡，詹娜公開整容后秀身材

首富貝索斯婚宴后，卡戴珊姐妹歐洲狂歡，詹娜公開整容后秀身材

藝兔體壇

2025-07-04 12:47:39

A股：今天，7月4號，三個信號來了！股市尾聲將至？

A股：今天，7月4號，三個信號來了！股市尾聲將至？

阿傖說事

2025-07-04 11:21:30

我高考700分，女友求我陪她去三本，我剛要同意，就看見了她成績

我高考700分，女友求我陪她去三本，我剛要同意，就看見了她成績

秋風專欄

2025-07-01 11:59:29

吉迪已向NBA聯盟提出申請，詢問是否可以在休賽期參加澳大利亞聯賽

吉迪已向NBA聯盟提出申請，詢問是否可以在休賽期參加澳大利亞聯賽

雷速體育

2025-07-04 13:36:16

俄軍進入殺戮模式？遇敵全殲不留活口，西方援兵連俘虜都做不成！

俄軍進入殺戮模式？遇敵全殲不留活口，西方援兵連俘虜都做不成！

健身狂人

2025-07-04 12:27:54

一個男人拿命愛你，并非給你做飯，也不是哄你，而是做一件事

一個男人拿命愛你，并非給你做飯，也不是哄你，而是做一件事

詩詞中國

2025-07-04 15:52:38

星光暗淡！西班牙公布歐錦賽15人名單：現役NBA球員僅阿爾達馬

星光暗淡！西班牙公布歐錦賽15人名單：現役NBA球員僅阿爾達馬

直播吧

2025-07-04 16:32:05

一覺醒來，李嘉誠的天塌了？香港權貴懷念殖民榮光的時代已經結束

一覺醒來，李嘉誠的天塌了？香港權貴懷念殖民榮光的時代已經結束

豆腐腦觀察局

2025-07-01 13:00:55

AI產業主平臺領航智能+時代

12988文章數 66082關注度

往期回顧全部

科技要聞

被雷軍"震驚"后，何小鵬"藏起"G7的戰報

頭條要聞

學者：泰柬沖突或引發域外大國介入插手中南半島事務

頭條要聞

學者：泰柬沖突或引發域外大國介入插手中南半島事務

體育要聞

體壇最爽打工人：37歲被裁，工資領到72歲

娛樂要聞

李宇春身上的標簽哪個才是真的？

財經要聞

闖禍電芯商部分產線停產!羅馬仕通知停工

汽車要聞

純電續航180km/或30萬級方程豹鈦7四季度上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戲

藝術

健康

公開課

教育要聞

從小學一年級用到六年級的巧算速算

《鬼武者》新作佐佐木性格癲狂與宮本武藏互為勁敵

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：理塘县| 宿州市| 昔阳县| 新河县| 庆城县| 永和县| 上思县| 宣城市| 濉溪县| 郸城县| 永安市| 昌黎县| 前郭尔| 拉萨市| 勐海县| 台北县| 太湖县| 佛学| 九龙城区| 礼泉县| 大埔县| 安远县| 英吉沙县| 陆良县| 通山县| 嘉定区| 满城县| 兴安县| 北宁市| 延长县| 奉新县| 同德县| 太康县| 桦甸市| 德昌县| 大洼县| 沈丘县| 疏勒县| 镇平县| 门头沟区| 泰安市|

<cite id="rsrfe"></cite>

<em id="rsrfe"></em><thead id="rsrfe"><rt id="rsrfe"><noscript id="rsrfe"></noscript></rt></thead><em id="rsrfe"><p id="rsrfe"><noscript id="rsrfe"></noscript></p></em>

<cite id="rsrfe"></cite>

<cite id="rsrfe"></cite>