99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

讀懂諾貝爾獎(一) | 聊聊機器學習那些事

0
分享至


01

兩位諾貝爾獎得主


約翰·J·霍普菲爾德(左),1933年出生于美國伊利諾伊州芝加哥市,1958年獲得美國康奈爾大學博士學位,現(xiàn)任美國普林斯頓大學教授。

杰弗里·E·辛頓(右),1947年出生于英國倫敦,1978年獲得英國愛丁堡大學博士學位,現(xiàn)任加拿大多倫多大學教授。

02

機器學習的3種基本方法


機器學習是人工智能和計算機科學的重要分支,是基于樣本數(shù)據(jù)構建模型并利用模型在沒有明確編程的情況下做出預測或決策的一類算法。監(jiān)督學習、無監(jiān)督和強化學習是機器學習的基本方法。

01

監(jiān)督學習

監(jiān)督學習使用人工標記的訓練樣本將已有知識應用于新數(shù)據(jù),以預測未來事件。1936年,英國數(shù)學家費希爾(Ronald Fisher)提出的線性判別分析是最早的監(jiān)督學習算法。20世紀50年代,基于貝葉斯決策理論的貝葉斯分類器開始被用于分類問題。1958年,美國認知心理學家羅森布拉特(Frank Rosenblatt)發(fā)明感知器算法,它被認為是人工神經(jīng)網(wǎng)絡的前身。1967年,美國信息理論家科弗(Thomas Cover)和計算機科學家哈特(Peter Hart)提出基于模板匹配思想的K-最近鄰算法。20世紀八九十年代,決策樹和神經(jīng)網(wǎng)絡算法開始興起。1995年,兩種重要算法——支持向量機和AdaBoost誕生。支持向量機是處理線性分類和非線性分類問題的主要方法,而AdaBoost可以將許多其他類型的算法集成起來使用以達到最佳性能。1995年至1997年,德國計算機科學家霍赫賴特(Sepp Hochreiter)和施米德胡貝(Juergen Schmidhuber)提出長短期記憶算法,可以部分處理梯度消失問題。2013年,長短期記憶算法與深度循環(huán)神經(jīng)網(wǎng)絡結合成功應用于語音識別。2001年,美國統(tǒng)計學家布賴曼(Leo Breiman)提出優(yōu)化的隨機森林算法。隨機森林是一個用隨機方式建立的包含多個決策樹的分類器,對多數(shù)據(jù)集和高維數(shù)據(jù)的處理有很大優(yōu)勢。

監(jiān)督學習的常見應用場景包括評估信用分數(shù)、手寫識別、語音識別、信息檢索、財務分析、偵測垃圾郵件等。

02無監(jiān)督學習

無監(jiān)督學習是基于統(tǒng)計的學習方法,通過對未知數(shù)據(jù)進行分析來發(fā)現(xiàn)數(shù)據(jù)隱藏特征。無監(jiān)督學習包括聚類和數(shù)據(jù)降維兩種主要算法類型。1963年,美國空軍研究員沃德(Joe Ward)根據(jù)方差分析提出了最早的聚類算法——層次聚類算法。1967年,美國數(shù)學家麥奎因(James MacQueen)提出的k均值算法是聚類算法中知名度最高的算法,在此基礎上出現(xiàn)了大量的改進算法和成功應用。1977年,美國統(tǒng)計學家登普斯特(Arthur Dempster)提出最大期望算法,被用于聚類問題和極大似然估計問題。1995年,美國辛辛那提大學教授程(Yizong Cheng)提出可用于計算機視覺和圖像處理的均值漂移算法。2000年,美國計算機科學家史建波(Jianbo Shi)推廣了譜聚類算法,可以將聚類問題轉(zhuǎn)化為圖的最優(yōu)切割問題。最早的數(shù)據(jù)降維算法是1901年英國數(shù)學家及生物統(tǒng)計學家皮爾遜(Karl Pearson)提出的主成分分析法,比第一臺真正的計算機的誕生早了40多年。然而,在此后的近100年里數(shù)據(jù)降維算法在機器學習領域沒有出現(xiàn)重量級成果。1998年,德國計算機科學家舍爾科普夫(Bernhard Sch?lkopf)提出基于核方法的核主成分分析算法,可以實現(xiàn)高維數(shù)據(jù)的非線性降維。2000年以后,流形學習開始成為熱點,它的主要思想是將高維的數(shù)據(jù)映射到低維,使該低維的數(shù)據(jù)能夠反映原高維數(shù)據(jù)的某些本質(zhì)結構特征。基于流行學習出現(xiàn)了局部線性嵌入、拉普拉斯特征映射、局部保持投影等距映射等新算法。2008年出現(xiàn)的t-分布式隨機鄰居嵌入算法是降維算法中最年輕的成員。

無監(jiān)督學習的常見應用場景包括反洗錢、客戶分組、廣告推薦、銷售趨勢預測等。

03

強化學習

強化學習源于心理學中的行為主義理論,強調(diào)智能體在獎勵或懲罰的環(huán)境刺激下如何做出能取得最大化預期利益的行動,也就是說,讓智能體在環(huán)境中自我學習。早在1954年,明斯基就提出了“強化學習”的概念和術語。1965年,美國普渡大學教授傅京孫(King-Sun Fu)在研究控制論時提出“智能控制”的概念,明確了“試錯”作為強化學習的核心機制。1957年,美國應用數(shù)學家貝爾曼(Richard Bellman)為了求解最優(yōu)控制問題的馬爾可夫決策過程提出了動態(tài)規(guī)劃法,這一方法采用了類似強化學習的試錯迭代求解機制。最早的強化學習算法是1988年加拿大計算機科學家薩頓(Richard Sutton)提出的時序差分學習,它不需要獲知環(huán)境的全部信息就可以直接從實際經(jīng)驗來獲取信息,同時不需要完整的收益反饋信息就可以實時更新決策。1989年,英國計算機科學家沃特金斯(Chris Watkins)提出的Q學習進一步拓展了強化學習的應用,使得強化學習不再依賴于問題模型,Q學習也因此成為最廣泛使用的強化學習方法之一。此后近20年的時間里,強化學習被監(jiān)督學習的光芒所遮掩而發(fā)展緩慢。2010年以后,強化學習結合神經(jīng)網(wǎng)絡發(fā)展出深度強化學習算法,強化學習由此迎來大發(fā)展時期。2013年,谷歌公司旗下的深度思維公司(DeepMind)發(fā)表了利用強化學習玩雅達利(Atari)游戲的論文。2015年,深度思維公司開發(fā)的AlphaGo程序擊敗了圍棋二段選手樊麾,成為第一個無須讓子即可以擊敗圍棋職業(yè)棋手的計算機圍棋程序。2016年,AlphaGo在一場五番棋比賽中以4:1擊敗頂尖圍棋職業(yè)棋手李世石。

強化學習的常見應用場景包括無人駕駛、機器翻譯、醫(yī)療保健、新聞定制、廣告營銷、機器人控制等。

03

深度學習發(fā)展歷程

為了理解此次獲獎的兩位科學家在機器學習發(fā)展過程中,究竟做出了怎樣的開創(chuàng)性貢獻,讓我們一同來回顧深度學習的發(fā)展歷程,在其中搜尋霍普菲爾德辛頓的名字。

深度學習是機器學習的一個分支,是一種模擬大腦神經(jīng)網(wǎng)絡結構對數(shù)據(jù)進行表征學習的方法。深度學習源于對人腦工作機制的研究。獲得1981年諾貝爾生理學或醫(yī)學獎的美國神經(jīng)生理學家休伯爾(David Hubel)和維澤爾(Torsten Wiesel)發(fā)現(xiàn)人的視覺系統(tǒng)的信息處理是分級的,人類對高層特征的感知基于低層特征的組合。例如,對人臉的識別經(jīng)過瞳孔攝入像素(形狀判斷)抽象出人臉概念——識別為人臉的過程,從低層到高層的特征表達越來越抽象和概念化。這一發(fā)現(xiàn)意味著大腦是一個深度架構,認知過程也是深度的,而深度學習恰恰就是通過組合低層特征形成更加抽象的高層特征。深度學習的發(fā)展可以分為感知器、神經(jīng)網(wǎng)絡和深度學習等3個階段。

1943年,美國心理學家麥卡洛克(Warren S. McCulloch)和數(shù)理邏輯學家皮茨(Walter Pitts)提出人工神經(jīng)網(wǎng)絡的概念,并構建了人工神經(jīng)元的數(shù)學模型,即MCP模型,從而開創(chuàng)了人工神經(jīng)網(wǎng)絡研究的時代。1949年,加拿大心理學家赫布(Donald Hebb)描述了突觸可塑性的基本原理,從神經(jīng)科學理論上解釋了學習過程中大腦神經(jīng)細胞所發(fā)生的變化。赫布理論是人工神經(jīng)網(wǎng)絡的生物學基礎。1958年,羅森布拉特在康奈爾航空實驗室發(fā)明感知器算法,這是世界上第一個具有完整算法描述的神經(jīng)網(wǎng)絡學習算法。感知器算法是簡單配置的單層神經(jīng)網(wǎng)絡,可以區(qū)分三角形等基本形狀。但是,受限于計算機硬件,感知器算法在當時無法被廣泛應用。1969年,明斯基和佩珀特(Seymour Papert)證明感知器不能解決簡單的異或(XOR)等線性不可分問題,感知器研究隨之在20世紀70年代陷入低谷。

1959年,休伯爾和維澤爾在研究貓的視覺神經(jīng)系統(tǒng)時發(fā)現(xiàn),在大腦的初級視覺皮層中存在兩種細胞:簡單細胞和復雜細胞,其中,簡單細胞感知光照信息,復雜細胞感知運動信息。受此啟發(fā),1980年日本計算機科學家福島邦彥(Kunihiko Fukushima)提出了一個網(wǎng)絡模型——“神經(jīng)認知機”(Neocognitron)。這種網(wǎng)絡分成多層,每層由一種神經(jīng)元組成。在網(wǎng)絡內(nèi)部,兩種神經(jīng)元交替出現(xiàn),分別用來提取圖形信息和組合圖形信息。這兩種神經(jīng)元后來分別演化成卷積層(Convolution Layer)和提取層(Pooling Layer)。然而,這個網(wǎng)絡的神經(jīng)元都是人工設計的而不能根據(jù)計算結果自動調(diào)整,所以只能識別少量簡單數(shù)字而不具備學習能力。

1982年,美國物理學家霍普菲爾德(John J. Hopfield)基于統(tǒng)計物理提出了有少量記憶能力的霍普菲爾德神經(jīng)網(wǎng)絡模型,開創(chuàng)性地論證了按照赫布法則設計權重的神經(jīng)網(wǎng)絡穩(wěn)定性問題。同年,芬蘭計算機科學家科霍寧(Teuvo Kohonen)通過模擬大腦神經(jīng)元的信號處理機制,提出了自組織映射網(wǎng)絡,被用于數(shù)據(jù)分析和數(shù)據(jù)探索,其第一個應用領域是語音分析。科霍寧的關鍵發(fā)明是引入了一個系統(tǒng)模型,包含一個實現(xiàn)贏家通吃功能的競爭性神經(jīng)網(wǎng)絡和一個實現(xiàn)可塑性控制的子系統(tǒng)。1987年,美國科學家格羅斯伯格(Stephen Grossberg)和卡彭特(Gail Carpenter)提出了自適應共振理論網(wǎng)絡,通過讓已知信息和未知信息發(fā)生“共振”,從已知信息推測未知信息來實現(xiàn)類比學習。然而,這些神經(jīng)網(wǎng)絡存在學習效率不高、需要不斷優(yōu)化設計、網(wǎng)絡記憶容量小等不足,實際應用范圍有限。

1986年,美國心理學家魯姆哈特(David Rumelhart)、計算機科學家威廉姆斯(Ronald Williams)和加拿大認知心理學家及計算機科學家辛頓(Geoffrey E. Hinton)共同提出反向傳播算法(BP算法)。BP算法通過梯度的鏈式法則使輸出結果和真實值之間的差異反饋到每一層的權重中,從而讓每一層函數(shù)都能像感知機那樣得到訓練。BP算法階段性解決了神經(jīng)網(wǎng)絡自適應、自主學習的難題。1989年,貝爾實驗室的法國計算機科學家楊立昆(Yann LeCun)第一次成功實現(xiàn)了神經(jīng)網(wǎng)絡的實踐應用。他將卷積神經(jīng)網(wǎng)絡與BP算法結合,提出LeNet網(wǎng)絡。20世紀90年代,美國郵政署將LeNet網(wǎng)絡用于自動讀取信封上的郵政編碼。然而,基于BP算法的神經(jīng)網(wǎng)絡僅能求解局部最優(yōu),而且這種情況隨著網(wǎng)絡層數(shù)的增加越來越嚴重,這一問題制約了神經(jīng)網(wǎng)絡的發(fā)展。

2006年,辛頓提出深度學習算法,通過無監(jiān)督學習和逐層預訓練的方式有效降低了訓練難度,從而解決了BP神經(jīng)網(wǎng)絡難以達到全局最優(yōu)的問題。2012年,辛頓的研究小組采用深度學習贏得了ImageNet圖像分類比賽的冠軍,準確率超出第二名10%以上,在計算機視覺領域產(chǎn)生極大震動,引發(fā)了深度學習的熱潮。2013年,《麻省理工科技評論》將深度學習列為年度世界十大技術突破之首。如今,深度學習已經(jīng)被廣泛用于搜索引擎、語音識別、自動機器翻譯、自然語言處理、自動駕駛、人臉識別等領域,是人工智能最熱門的研究方向之一。

“獲獎者的工作已經(jīng)產(chǎn)生了巨大的效益。在物理學領域,我們將人工神經(jīng)網(wǎng)絡應用于廣泛的領域,例如開發(fā)具有特定屬性的新材料。”2024年諾貝爾物理學獎委員會主席穆恩斯(Ellen Moons) 如是說。

本文作者為中國科協(xié)創(chuàng)新戰(zhàn)略研究院博士后王楠、中國科協(xié)創(chuàng)新戰(zhàn)略研究院研究員王國強。

本文節(jié)選自《智能時代的算法發(fā)展》,微信公眾號發(fā)表時有改動。文中圖片均來自瑞典皇家科學院。

科學畫報

2024年諾貝爾獎系列文章敬請期待

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
庫克尷尬了,蘋果坐了四年“全球賺錢第一”寶座后,跌至第2名了

庫克尷尬了,蘋果坐了四年“全球賺錢第一”寶座后,跌至第2名了

互聯(lián)網(wǎng).亂侃秀
2025-06-05 16:19:16
半場0-1,中國隊陷入絕境,楊澤翔送點釀苦果,世界杯夢想難了

半場0-1,中國隊陷入絕境,楊澤翔送點釀苦果,世界杯夢想難了

側(cè)身凌空斬
2025-06-05 22:38:20
凌晨有了結果!14票贊成,被美國一票否決!中方代表:美國再次濫用否決權,必須面對拷問

凌晨有了結果!14票贊成,被美國一票否決!中方代表:美國再次濫用否決權,必須面對拷問

魯中晨報
2025-06-05 08:26:06
給餐飲業(yè)留一條活路吧

給餐飲業(yè)留一條活路吧

今綸財經(jīng)
2025-06-04 18:07:58
特朗普:美方將繼續(xù)奉行一個中國政策

特朗普:美方將繼續(xù)奉行一個中國政策

財聯(lián)社
2025-06-05 22:44:31
71歲伊萬即將下課!倒計時5天+中國足協(xié)無需支付違約金 坑慘國足

71歲伊萬即將下課!倒計時5天+中國足協(xié)無需支付違約金 坑慘國足

念洲
2025-06-05 23:48:06
比房價下跌更擔憂,2025年退休人員的苦日子,很可能真要開始了

比房價下跌更擔憂,2025年退休人員的苦日子,很可能真要開始了

巢客HOME
2025-06-05 05:05:03
俄方送回6000具士兵遺體,烏克蘭急得跳腳,900億撫恤金上哪去湊

俄方送回6000具士兵遺體,烏克蘭急得跳腳,900億撫恤金上哪去湊

碳基生物關懷組織
2025-06-04 18:32:55
李在明榮登大位,第一通電話不是打給特朗普,首要任務與中國相關

李在明榮登大位,第一通電話不是打給特朗普,首要任務與中國相關

小嵩
2025-06-04 14:15:53
潛伏在中國的反華家族,靠大陸收入上億,如今終于被曝光!

潛伏在中國的反華家族,靠大陸收入上億,如今終于被曝光!

大歪歪
2025-06-05 21:05:48
大反轉(zhuǎn)!三亞27歲女游客并非被毒蛇咬傷致死,百萬網(wǎng)紅阿寶翻車了

大反轉(zhuǎn)!三亞27歲女游客并非被毒蛇咬傷致死,百萬網(wǎng)紅阿寶翻車了

古希臘掌管松餅的神
2025-06-05 18:19:19
驚險!中國出發(fā)的運輸船起火,載有800輛電動汽車,汽車品牌成謎

驚險!中國出發(fā)的運輸船起火,載有800輛電動汽車,汽車品牌成謎

烏娛子醬
2025-06-05 15:27:26
赫爾松州政府大樓被導彈擊中 烏方公布遭襲瞬間視頻

赫爾松州政府大樓被導彈擊中 烏方公布遭襲瞬間視頻

國際在線
2025-06-05 22:20:51
大風追蹤 | 浙江溫嶺23歲失聯(lián)女孩疑找到,警方稱需DNA鑒定才能確定

大風追蹤 | 浙江溫嶺23歲失聯(lián)女孩疑找到,警方稱需DNA鑒定才能確定

大風新聞
2025-06-05 15:00:13
約基奇加盟快船,NBA震撼交易方案曝光,杜蘭特怒斥這是作弊

約基奇加盟快船,NBA震撼交易方案曝光,杜蘭特怒斥這是作弊

夕落秋山
2025-06-06 00:30:15
俄戰(zhàn)略軍機被炸,真相終于大白,中美這次被都烏方無恥上了一課

俄戰(zhàn)略軍機被炸,真相終于大白,中美這次被都烏方無恥上了一課

大白話瞰世界
2025-06-04 13:26:42
女子被蛇咬去世后續(xù):責任不在醫(yī)院,錯失4次活命機會,男友表態(tài)

女子被蛇咬去世后續(xù):責任不在醫(yī)院,錯失4次活命機會,男友表態(tài)

凡知
2025-06-04 18:40:43
國產(chǎn)“路虎攬勝”來了,車長5米4,配三激光雷達,擁有1197馬力!

國產(chǎn)“路虎攬勝”來了,車長5米4,配三激光雷達,擁有1197馬力!

小怪吃美食
2025-06-06 02:21:54
西安上空現(xiàn)大量白點狀不明飛行物,當?shù)鼐W(wǎng)友曬視頻揭秘真相,兩部門回應

西安上空現(xiàn)大量白點狀不明飛行物,當?shù)鼐W(wǎng)友曬視頻揭秘真相,兩部門回應

極目新聞
2025-06-05 21:18:18
鄭欽文獲44萬歐獎金,“含淚”支付180萬抽成后,卻笑的更加燦爛

鄭欽文獲44萬歐獎金,“含淚”支付180萬抽成后,卻笑的更加燦爛

夢史
2025-06-05 14:09:27
2025-06-06 03:40:49
科學畫報 incentive-icons
科學畫報
中國最悠久的綜合性科普期刊
537文章數(shù) 31871關注度
往期回顧 全部

科技要聞

對話盛景網(wǎng)聯(lián)彭志強:跳出SaaS虧損黑洞!從“賣工具”到“賣結果”的AI RaaS轉(zhuǎn)型法則

頭條要聞

27歲女子被咬傷身亡 三亞衛(wèi)健委再通報搶救全過程

頭條要聞

27歲女子被咬傷身亡 三亞衛(wèi)健委再通報搶救全過程

體育要聞

提前無緣美加墨世界杯 國足眾將賽后落淚

娛樂要聞

陳赫宴請好友,李乃文攜妻子罕見亮相

財經(jīng)要聞

習近平同美國總統(tǒng)特朗普通電話

汽車要聞

旗艦+大六座+百萬級 阿維塔全新SUV預計明年量產(chǎn)

態(tài)度原創(chuàng)

教育
藝術
房產(chǎn)
時尚
公開課

教育要聞

期末考試終于敲定!南京中小學暑假延長了?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產(chǎn)要聞

再奪荔灣銷冠!誰是主城改善標準制定者,終于有了答案!

泰權威!復刻三分已成濃顏貴女

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 西畴县| 平塘县| 娱乐| 安西县| 杨浦区| 丰原市| 安仁县| 张掖市| 玛多县| 玉龙| 托克托县| 京山县| 龙口市| 濮阳市| 上栗县| 闽清县| 乌拉特中旗| 宜兰市| 海伦市| 襄垣县| 昌平区| 奎屯市| 陇川县| 临湘市| 巩义市| 集贤县| 航空| 瓮安县| 宁明县| 广德县| 满城县| 潞西市| 河南省| 神木县| 修武县| 台中市| 醴陵市| 巴彦县| 大理市| 上饶市| 克拉玛依市|