作者|藍(lán)字
原創(chuàng)首發(fā)|藍(lán)字計(jì)劃
“十年之內(nèi),數(shù)字計(jì)算機(jī)將成為國(guó)際象棋世界冠軍?!?/p>
這是1958年,第一代的AI研究者艾倫·紐厄爾(Allen Newell)和赫伯特·西蒙(Herbert Simon)做出的預(yù)言。
兩年前的1956年8月31日,一批來(lái)自計(jì)算機(jī)、數(shù)學(xué)、信息學(xué)等領(lǐng)域的頂尖科學(xué)家齊聚于美國(guó)東北部康涅狄格河河谷的達(dá)特茅斯學(xué)院,共同討論“人工智能”的定義。這次達(dá)特茅斯會(huì)議足足持續(xù)了一個(gè)月,直接促成了日后的“人工智能革命”。AI行業(yè)就此誕生。
| 達(dá)特茅斯會(huì)議的第一代AI研究者
在互聯(lián)網(wǎng)尚未誕生的年代,第一代AI研究者,就已經(jīng)暢想著AI革命會(huì)幫助人類(lèi)解決數(shù)學(xué)、物理乃至日常生活的諸多難題,將人類(lèi)社會(huì)帶向更美好的未來(lái)。
但AI的發(fā)展,并不像想象中那么順利,甚至有人將它與時(shí)髦卻無(wú)用的煉金術(shù)相提并論。
第一次AI浪潮,因?yàn)槭苤朴谟?jì)算機(jī)運(yùn)算能力,陷入低谷;第二次AI浪潮,AI的發(fā)展反而遠(yuǎn)遠(yuǎn)落后于個(gè)人電腦的性能提升。AI行業(yè)兩度浮沉。
直到達(dá)特茅斯會(huì)議召開(kāi)四十年后,超級(jí)計(jì)算機(jī)“深藍(lán)”才終于擊敗國(guó)際象棋世界冠軍卡斯帕羅夫。又過(guò)了差不多二十年, AlphaGo又擊敗贏得過(guò)14次世界冠軍的圍棋九段棋手李世石。AI席卷棋盤(pán),碾壓人類(lèi)的智力,卻又點(diǎn)亮人類(lèi)希望——
從國(guó)際象棋到圍棋,還有更大、更復(fù)雜的棋盤(pán)讓AI馳騁嗎?
從脈沖星出擊
騰訊優(yōu)圖實(shí)驗(yàn)室研究總監(jiān)汪鋮杰沒(méi)有想到,自己和團(tuán)隊(duì)會(huì)跟天文學(xué)產(chǎn)生聯(lián)系。過(guò)去多年,優(yōu)圖實(shí)驗(yàn)室的技術(shù)廣泛用于肢體動(dòng)作識(shí)別、工業(yè)AI質(zhì)檢、人像分割及虛擬背景等。
2020年冬天,他和同事們開(kāi)了一次頭腦風(fēng)暴會(huì),討論除了常規(guī)工業(yè)領(lǐng)域的應(yīng)用以外,AI還能做哪些事情?
有同事說(shuō)出了一個(gè)令在場(chǎng)大多數(shù)人感到陌生的詞:FAST。
FAST,全稱(chēng)是Five-hundred-meter Aperture Spherical radio Telescope ,即500米口徑球面射電望遠(yuǎn)鏡,坐落在貴州,是國(guó)家天文臺(tái)的重要觀測(cè)設(shè)備,外界一般稱(chēng)之為“中國(guó)天眼”。自2016年正式投入運(yùn)行以來(lái),它已經(jīng)解鎖了不少世界級(jí)的成就:觀測(cè)到宇宙極端爆炸起源證據(jù)、發(fā)現(xiàn)了迄今為止唯一一例持續(xù)活躍的重復(fù)快速射電暴……
| FAST,又稱(chēng)“中國(guó)天眼”
作為世界上靈敏度最高的望遠(yuǎn)鏡,它帶回海量天文數(shù)據(jù),如何處理這些數(shù)據(jù),一直是個(gè)難題,僅脈沖星搜索這個(gè)項(xiàng)目的數(shù)據(jù)一周就約有500TB,大約相當(dāng)于3000萬(wàn)張信號(hào)圖。
這個(gè)量級(jí)的數(shù)據(jù),靠人工處理是不現(xiàn)實(shí)的。國(guó)家天文臺(tái)助理研究員潘之辰博士曾對(duì)著電腦看脈沖星信號(hào)圖,“是人的極限了,盯著屏幕,很使勁地看”,一天能看一萬(wàn)多張。按照這個(gè)速度判別脈沖星信號(hào)圖,即使每天24小時(shí)不吃不喝不休息,也需要1年才能處理完。
| 脈沖星周期信號(hào)圖,圖源受訪者
如果有專(zhuān)門(mén)的AI技術(shù)來(lái)幫助天文科學(xué)家們識(shí)別脈沖星信號(hào),效率或許有質(zhì)變。
汪鋮杰與實(shí)驗(yàn)室的研究員們達(dá)成了共識(shí)——在選出來(lái)的十個(gè)項(xiàng)目中,F(xiàn)AST排在第一位。國(guó)家天文臺(tái)也盼望AI能帶來(lái)不一樣的東西。
“探星計(jì)劃”來(lái)了,這一次,等待AI的棋盤(pán)是宇宙。
但開(kāi)局便逢難題。訓(xùn)練AI優(yōu)化需要用大數(shù)據(jù)“喂”,F(xiàn)AST接收到的信號(hào)雖然是海量,但可用于學(xué)習(xí)的、真的脈沖星的量級(jí)也就在100個(gè)左右。
樣本太小,AI吃不飽,學(xué)不會(huì)。
優(yōu)圖實(shí)驗(yàn)室的探星團(tuán)隊(duì)采用了“半監(jiān)督學(xué)習(xí)”方法,先用小樣本訓(xùn)練AI模型,再讓它去分類(lèi)大量的未標(biāo)注的數(shù)據(jù),反過(guò)來(lái)利用得到的結(jié)果繼續(xù)迭代優(yōu)化,就像人腦的學(xué)習(xí)模式,舉一反三。
| 優(yōu)圖的研究員在討論AI模型設(shè)計(jì),圖源受訪者
噪聲干擾是另外一個(gè)問(wèn)題。不同于以往做工業(yè)質(zhì)檢時(shí)收集到的較為干凈的數(shù)據(jù),只要錨定一個(gè)標(biāo)準(zhǔn),即可做出判斷。脈沖星信號(hào)本身就不是千篇一律的,F(xiàn)AST收集到的海量數(shù)據(jù)中,不僅包含可以簡(jiǎn)單過(guò)濾的無(wú)效數(shù)據(jù),還有宇宙發(fā)出的大量疑似脈沖星的各種噪聲。
還有就是效率。AI不僅需要能夠篩選出脈沖星,速度還必須快。根據(jù)優(yōu)圖實(shí)驗(yàn)室的統(tǒng)計(jì),想要找到一顆脈沖星,可能需要處理3000萬(wàn)到1億張信號(hào)圖,沒(méi)有時(shí)間慢慢“欣賞”。
| 脈沖星動(dòng)態(tài)譜信號(hào)圖,圖源受訪者
優(yōu)圖實(shí)驗(yàn)室此前在工業(yè)AI質(zhì)檢項(xiàng)目上的經(jīng)驗(yàn)起了作用。探星計(jì)劃中是在數(shù)以?xún)|計(jì)的圖片中,篩選出“正確”的答案——脈沖星;工業(yè)質(zhì)檢上,則是在良品率在99%以上的流水線(xiàn)上,找到“錯(cuò)誤”的缺陷品。信號(hào)圖篩選和缺陷品檢測(cè)的底層技術(shù)是相通的。
在多方努力下,AI模型得以實(shí)現(xiàn)了多次迭代優(yōu)化,最終達(dá)到質(zhì)變。
對(duì)比之前,圖片數(shù)據(jù)處理速度提升了超過(guò)120倍——過(guò)去人工需要一年的工作,AI不到三天就能完成,數(shù)據(jù)處理的誤報(bào)率也下降了98%。
一年過(guò)后,“探星計(jì)劃”交出了首份成績(jī)單:騰訊優(yōu)圖實(shí)驗(yàn)室已用“云+AI”幫助FAST新發(fā)現(xiàn)了22顆脈沖星,其中包含高速自轉(zhuǎn)的毫秒脈沖星7顆,具有間歇輻射現(xiàn)象的年老脈沖星6顆。
探星計(jì)劃的成功證明了AI用于基礎(chǔ)科學(xué)這條路是可行的,AI在宇宙這個(gè)棋盤(pán)上,又贏了。
被太空訓(xùn)導(dǎo)的AI
探星計(jì)劃并不是產(chǎn)業(yè)力量與基礎(chǔ)科學(xué)的第一次結(jié)合。
1969年7月20日,距離尼爾·阿姆斯特朗(Neil Armstrong)邁出“我的一小步”約122米的月球上空,登月艙內(nèi)突然傳來(lái)警報(bào)。警報(bào)顯示,機(jī)載電腦可能即將停機(jī),導(dǎo)致登月失敗,阿姆斯特朗和登月團(tuán)隊(duì)必須在數(shù)秒鐘內(nèi)做出關(guān)鍵決定。
此時(shí),38萬(wàn)公里外的地球上,來(lái)自IBM的工程師迅速向NASA反饋了他們的判斷:機(jī)載電腦不會(huì)停機(jī),登月可以繼續(xù)。阿姆斯特朗就此邁出了“人類(lèi)一大步”。
NASA飛行指揮官吉恩·克蘭茲(Gena Kranz)毫不掩飾地指出,“如果沒(méi)有IBM 和他們所提供的系統(tǒng),我們就無(wú)法登上月球”。在上個(gè)世紀(jì)60年代,集成電路才剛剛出現(xiàn)不久,無(wú)論是最初的真空管計(jì)算機(jī),還是后來(lái)的晶體管計(jì)算機(jī),對(duì)于登月任務(wù)來(lái)說(shuō)都算得上“龐然大物”。
| 上個(gè)世紀(jì)60年代的計(jì)算機(jī)
計(jì)算機(jī)小型化成為了登月的必然需求。當(dāng)時(shí)的計(jì)算機(jī)巨頭IBM,派出了4000名工程師、研究員、科學(xué)家,編寫(xiě)了500萬(wàn)行代碼,從軟件到硬件上解決了這一難題。
在此之后,第一部大量生產(chǎn)的個(gè)人電腦Datapoint 2200出現(xiàn),第一臺(tái)商用筆記本電腦IBM 5100出現(xiàn),人類(lèi)社會(huì)迅速進(jìn)入了個(gè)人電腦的時(shí)代。
沒(méi)有這一次產(chǎn)業(yè)與基礎(chǔ)科學(xué)結(jié)合的嘗試,很難說(shuō)家用電腦的普及還要晚多久。
在尋找脈沖星過(guò)程中,也讓優(yōu)圖實(shí)驗(yàn)室收獲良多。AI要準(zhǔn)確判斷數(shù)十億計(jì)的海量圖片數(shù)據(jù),這倒逼工程師對(duì)AI性能做更極致的優(yōu)化。另外,在構(gòu)建AI模型中涉及到的無(wú)監(jiān)督、異常檢測(cè)、主動(dòng)學(xué)習(xí)的這些技術(shù),都來(lái)自對(duì)實(shí)踐經(jīng)驗(yàn)的改進(jìn)。這些優(yōu)化與積累最終都會(huì)成為可以復(fù)用的經(jīng)驗(yàn),又重新用于其他行業(yè)。
當(dāng)然,產(chǎn)業(yè)力量與基礎(chǔ)科學(xué)可以做到的事情,不止是天文,還有更多。
科學(xué)家的高空纜車(chē)
事實(shí)上,AI最早進(jìn)入的基礎(chǔ)科學(xué)領(lǐng)域是生物學(xué)。
一個(gè)簡(jiǎn)單的蛋白質(zhì)包含了數(shù)百個(gè)氨基酸,其空間結(jié)構(gòu)的可能性就高達(dá)10的300次方。對(duì)于海量信息的處理,恰恰是AI的拿手好戲。斯坦福大學(xué)研究團(tuán)隊(duì)今年就利用AI技術(shù)將DNA測(cè)序的速度提升到了5小時(shí),比早前14個(gè)小時(shí)的記錄縮短了超過(guò)一半。相較于此前花費(fèi)數(shù)十億美元的人類(lèi)基因組計(jì)劃,如今它的成本僅需3萬(wàn)美元。
| AI測(cè)序得出的DNA結(jié)構(gòu)
2009年,威爾士亞伯大學(xué)的羅斯·金(Ross King)曾打造了一臺(tái)“機(jī)器人科學(xué)家”亞當(dāng),與以往由研究人員來(lái)設(shè)計(jì)實(shí)驗(yàn)機(jī)器作為輔助不同,亞當(dāng)可以根據(jù)算法自行生成實(shí)驗(yàn)假設(shè),并利用機(jī)身設(shè)備進(jìn)行實(shí)驗(yàn)。
它曾被用于檢驗(yàn)酵母菌不同DNA片段對(duì)最終生成酵母酶的影響——在遠(yuǎn)超人類(lèi)科學(xué)家的一天1000次試驗(yàn)的速度下,亞當(dāng)很快發(fā)現(xiàn)了三個(gè)基因與酵母酶的關(guān)聯(lián),其中一組被人類(lèi)科學(xué)家復(fù)現(xiàn)驗(yàn)證。金教授的團(tuán)隊(duì)還研發(fā)了一臺(tái)機(jī)器人“夏娃”,利用AI跑實(shí)驗(yàn)假說(shuō)和數(shù)據(jù),加快新藥物的研究,比如治療瘧疾和其他被忽視的熱帶疾病的藥物。
| 亞當(dāng)可以利用機(jī)身設(shè)備自動(dòng)完成實(shí)驗(yàn)
識(shí)別昆蟲(chóng)也是AI的拿手好戲。果蠅由于染色體少,突變型多,易培育,是研究遺傳和演化的相關(guān)實(shí)驗(yàn)中最常見(jiàn)的模式物種。但果蠅科內(nèi)的已描述物種超過(guò)4000個(gè),識(shí)別起來(lái)有一定難度,實(shí)驗(yàn)員們需要用顯微鏡拍下來(lái)對(duì)不同的果蠅分類(lèi)。直到AI自動(dòng)識(shí)別軟件的加入,實(shí)驗(yàn)員拿手機(jī)拍張照片就能完成同樣的工作。
在化學(xué)界,格拉斯哥大學(xué)的化學(xué)家李·克羅寧(Lee Cronin)在2018年也設(shè)計(jì)了一個(gè)以AI為核心的自動(dòng)化實(shí)驗(yàn)設(shè)備。AI會(huì)在虛擬空間隨即合成任意化學(xué)物質(zhì),再通過(guò)AI連接的真實(shí)設(shè)備嘗試合成,最后還會(huì)有驗(yàn)證、修訂實(shí)驗(yàn)的過(guò)程。研究人員希望,這個(gè)AI能幫助加速對(duì)生命誕生過(guò)程的探索。
還有數(shù)學(xué)。
在前不久的世界人工智能大會(huì)上,著名數(shù)學(xué)家丘成桐就舉了一個(gè)例子:數(shù)學(xué)界有一個(gè)很出名的問(wèn)題,就是有限群分類(lèi)的問(wèn)題。有限分類(lèi)由很多數(shù)學(xué)家共同合作完成,但是整篇文章有幾千頁(yè)紙的證明,100頁(yè)的證明還可以勉強(qiáng)念完,但是幾千頁(yè)紙的證明很難完成。丘成桐認(rèn)為,人工智能可以在設(shè)計(jì)算法模型幫忙了解這個(gè)證明有沒(méi)有缺憾。
他甚至期待,“人工智能能夠幫我們了解兩個(gè)不同的學(xué)科,讓人類(lèi)能夠結(jié)合起來(lái),產(chǎn)生一個(gè)新的學(xué)科”。
甚至,包括古文字學(xué)。
自從1899年金石學(xué)家王懿榮在河南安陽(yáng)發(fā)現(xiàn)甲骨文以來(lái),全世界陸續(xù)發(fā)現(xiàn)的殷商甲骨文已經(jīng)在5000個(gè)字左右,但真正被釋讀出來(lái)的字?jǐn)?shù)僅在1500-2000字之間,連已經(jīng)破譯的甲骨文中,也有一批字的解釋存在爭(zhēng)議。
| 甲骨文的識(shí)別與破譯仍是一個(gè)難題
以至于2017年,中國(guó)文字博物館甚至斥巨資,以“破譯單個(gè)甲骨文獎(jiǎng)勵(lì)10萬(wàn)元”的天價(jià),懸賞一批總量近3500字需要釋讀的疑難甲骨文。
優(yōu)圖實(shí)驗(yàn)室的新目標(biāo)之一,就是和古文字學(xué)家們,一同識(shí)別出更多新的甲骨文。
AI就像一臺(tái)永不疲倦的高空纜車(chē),讓越來(lái)越多的科學(xué)家得以攀上一座座原本難以企及的山峰。
能給人類(lèi)生活帶來(lái)什么?
今年4月開(kāi)始,廣東珠海金灣區(qū)的18個(gè)河涌上,多了一個(gè)個(gè)瞄準(zhǔn)水面的攝像頭。
它們是目前正在落地的AI環(huán)保監(jiān)管識(shí)別系統(tǒng)的重要組成部分。水面上的漂浮物,無(wú)論是塑料瓶、泡沫箱,還是樹(shù)木殘枝,系統(tǒng)都會(huì)自動(dòng)識(shí)別并一一給予標(biāo)注,并且可以實(shí)現(xiàn)24小時(shí)“自動(dòng)值守”。
| AI正對(duì)漂浮物進(jìn)行識(shí)別,圖片來(lái)源:公眾號(hào)“珠海金灣”
通過(guò)視頻系統(tǒng)的AI智能算法,攝像頭還具備了主動(dòng)識(shí)別水體顏色變化、異常活動(dòng)等環(huán)境污染問(wèn)題和隱患,還能自動(dòng)生成證據(jù)鏈、視頻、截圖等證據(jù)信息。
自上線(xiàn)以來(lái),系統(tǒng)已經(jīng)識(shí)別到4049次水污染風(fēng)險(xiǎn)因素,包括3568次漂浮物污染、474次異常人員活動(dòng)以及7次水質(zhì)渾濁事件。
這是為了解決以往城市水體治理中的滯后性與被動(dòng)性的一次嘗試。十四五規(guī)劃中,珠海的目標(biāo)是地表水考核斷面水質(zhì)優(yōu)良比例需由 2019 年的 66.7%上升為 100%。AI的加入,帶來(lái)了加速達(dá)成目標(biāo)的可能。
用AI機(jī)器人輔助人工垃圾分類(lèi),以避免環(huán)衛(wèi)工人受傷;監(jiān)測(cè)企業(yè)的廢氣、廢水排放情況,以預(yù)見(jiàn)污染風(fēng)險(xiǎn)、跟蹤隱患整改;智能交通燈,以緩解城市交通擁擠的難題......AI可以讓我們的城市變得更好。
| 麻省理工的垃圾分類(lèi)AI
與此同時(shí),AI也開(kāi)始在不同行業(yè)嘗試落地。
前面提到過(guò)工業(yè)質(zhì)檢AI,知名顯示屏生產(chǎn)商華星光電便利用這一技術(shù)開(kāi)發(fā)出自動(dòng)缺陷分類(lèi)項(xiàng)目,AI識(shí)別速度相比人工提升了3-4倍,還能晝夜不停地在生產(chǎn)線(xiàn)上隨時(shí)發(fā)現(xiàn)殘次面板,得以節(jié)省了1000萬(wàn)元的成本。
醫(yī)學(xué)方面,中山大學(xué)附屬第一醫(yī)院、廣東省婦幼保健院等全國(guó)100多家醫(yī)院已經(jīng)開(kāi)始使用超聲AI智能化系統(tǒng)。它可以在產(chǎn)前篩查作出判斷,避免嚴(yán)重出生缺陷兒的出生,保障孕婦健康和胎兒的正常發(fā)育。類(lèi)似的AI醫(yī)學(xué)影像分析、癌癥篩查,也在嘗試克服疲勞對(duì)人工診斷的影響,提高準(zhǔn)確率。
這和汪鋮杰想看到的未來(lái)更接近了,“我們希望能夠看到AI技術(shù)在各行各業(yè)里面的應(yīng)用和落地能力,而且是能夠?qū)崒?shí)在在的為某一個(gè)行業(yè)帶來(lái)比較實(shí)質(zhì)性的變化”。
探星計(jì)劃如今的新目標(biāo),是開(kāi)啟對(duì)M31仙女座星云的射電信號(hào)處理,這也是天文界首次對(duì)該星系觀測(cè)的射電信號(hào)進(jìn)行完整處理和探測(cè)。
| M31仙女座星系
除了甲骨文,優(yōu)圖視覺(jué)AI的新目標(biāo)還有“農(nóng)作物病蟲(chóng)害AI識(shí)別項(xiàng)目”——這又是一次新的跨界。
這很像對(duì)第一次工業(yè)革命精神的致敬——從生活與生產(chǎn)場(chǎng)景中提煉科學(xué),最終反哺社會(huì)。馬德堡半球?qū)嶒?yàn)證明了真空的存在,波義耳給出了波義耳定律,他的助手發(fā)明了蒸汽蒸煮器,瓦特改良了蒸汽機(jī),尼古拉·卡諾又在前人的基礎(chǔ)上讓熱力學(xué)成為了現(xiàn)代科學(xué)的標(biāo)志。
AI普適化過(guò)程中與人的結(jié)合、互動(dòng)、突破,可能帶來(lái)人類(lèi)文明的又一次技術(shù)革命。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.