撰 文|黑爪
人類自古就在夢想,要制造出會(huì)思考的機(jī)器。這個(gè)愿望至少可以追溯到古希臘時(shí)代,傳說中的皮格馬利翁、代達(dá)洛斯、赫菲斯托斯都被賦予了傳奇發(fā)明家的形象,經(jīng)他們之手而誕生的葛拉蒂雅、塔羅斯、潘多拉,也許便是出現(xiàn)在人類敘述中最早的人工智能。
今天,人工智能已經(jīng)真實(shí)地活躍在眾多的應(yīng)用和研究領(lǐng)域。但它不是魔術(shù),也不創(chuàng)造奇跡。讓我們透過喧囂,回顧一下人工智能的前世今生,借此看清它究竟是什么,現(xiàn)在能作什么,未來能作什么。
早期的人工智能,迅捷地攻占了一些對(duì)人類大腦而言相對(duì)困難,而對(duì)計(jì)算機(jī)來說則顯得直截了當(dāng)?shù)膯栴},換句話說,那些可以用一系列數(shù)學(xué)規(guī)則所描述的問題。
但人工智能所面臨的真正挑戰(zhàn)卻恰恰相反。我們希望它能替代我們的,有更多的是人類很容易執(zhí)行,卻非常難以用規(guī)則來描述的任務(wù),那些我們通過直覺來解決的問題。例如,聽懂別人說話,或者在一幅圖片里找到人臉。
第一波浪潮:
難以理解現(xiàn)實(shí)的專家系統(tǒng)
人工智能的第一次技術(shù)發(fā)展,是基于人類專家知識(shí)的人工智能。人工智能專家提取特定領(lǐng)域的知識(shí),將其轉(zhuǎn)換成可輸入計(jì)算機(jī)的規(guī)則,以及遵循不同規(guī)則帶來的不同后果。計(jì)算機(jī)繼而運(yùn)用邏輯推理來“懂得”這些采用正規(guī)語言所描述的說明。
這個(gè)技術(shù)可以用于日程安排,棋類游戲(例如IBM戰(zhàn)勝國際象棋大師卡斯帕羅夫的超級(jí)計(jì)算機(jī)深藍(lán)),或者替人報(bào)稅等,有非常明確而具體的條件,執(zhí)行明確的任務(wù)。對(duì)現(xiàn)實(shí)世界進(jìn)行認(rèn)知,則是第一波人工智能的短板。此外,它不具備自我訓(xùn)練和提高的能力,這恰恰又是作為智能體的一個(gè)要素。那期間有個(gè)著名的項(xiàng)目叫作Cyc,由推理引擎加數(shù)據(jù)庫組成。人們希望這樣的一套系統(tǒng),可以利用足夠的復(fù)雜度,來精確地描述現(xiàn)實(shí)世界。然而Cyc讓人失望了。例如,它試圖去讀一個(gè)故事,故事里有個(gè)人叫弗雷德,每天早上會(huì)刮胡子。然而它的推理引擎檢測到了故事中有一處前后矛盾:它知道人的身上沒有電動(dòng)部件,可是每當(dāng)弗雷德剃須時(shí)手里拿著電動(dòng)剃須刀,于是它相信這個(gè)“剃須時(shí)的弗雷德”身上包含了電動(dòng)部件,因此它問,弗雷德剃須時(shí)還是不是人。
這是仰仗硬編碼知識(shí)的智能系統(tǒng),也就是第一波人工智能所面臨的一個(gè)經(jīng)典困難。它說明人工智能系統(tǒng)需要具備通過從元數(shù)據(jù)中提取規(guī)律來自主獲取知識(shí)的能力,這就是我們今天說的機(jī)器學(xué)習(xí)。
但這并不意味著第一波技術(shù)對(duì)于今天毫無意義,去年美國國防高研署(DARPA)成功完成了一項(xiàng)數(shù)字安全測試,便是基于第一波人工智能技術(shù)的應(yīng)用。孤立的技術(shù),在外部環(huán)境(硬件、數(shù)據(jù)量、配套技術(shù))不成熟的情況下,可以作的另一件事,就是等待。
第二波浪潮:
個(gè)體精度欠缺的機(jī)器學(xué)習(xí)系統(tǒng)
第二波人工智能出現(xiàn)的最好例子,也出自美國國防高研署。他們在2004到2005年兩年間鼓勵(lì)并組織業(yè)界進(jìn)行了大量的自駕車研究,并推出一個(gè)挑戰(zhàn)賽,看誰的自駕車能在加利福尼亞和內(nèi)華達(dá)的沙漠里跑150英里。結(jié)果,2004年那一屆,沒有一輛車跑完,事實(shí)上沒有一輛車跑過了8英里。原因是這些自駕車的視覺系統(tǒng)分辨不出遠(yuǎn)處的黑色物體,究竟是陰影還是石塊,“我”是應(yīng)該避開呢,還是應(yīng)該碾過去。因此它們大多在這個(gè)問題上翻了船。到了2005年這一屆,情況一下子大不一樣,有5輛車跑完了全程。
造成這個(gè)差別的原因,正是他們大多開始使用機(jī)器學(xué)習(xí)的技術(shù),運(yùn)用概率方法來處理信息。這就是人工智能技術(shù)的第二波。
這一波的特點(diǎn)是統(tǒng)計(jì)學(xué)習(xí)。它在語音識(shí)別,人臉識(shí)別等應(yīng)用領(lǐng)域作得非常成功。人們常常會(huì)說,計(jì)算機(jī)“就是”會(huì)學(xué)習(xí)啊。但事實(shí)真的不是你以為的那樣“就是”,若沒有背后強(qiáng)大的,將現(xiàn)實(shí)問題用統(tǒng)計(jì)數(shù)學(xué)模型來描述的支撐,它便“就是”不會(huì)學(xué)習(xí)。
我們現(xiàn)在看見的、談?wù)摰模⑶艺嬲龖?yīng)用到商業(yè)領(lǐng)域的,大多是此處描述的第二波人工智能技術(shù)。撇開它鋪天蓋地的輿論影響,真正被有效利用的類型極其有限。近來幾乎所有的人工智能進(jìn)展都只是一種,那就是輸入數(shù)據(jù)(A),迅速產(chǎn)生簡單響應(yīng)(B),如表 1所示。
就這么簡單地輸入A,輸出B,已經(jīng)足夠改變許多行業(yè)了。然而“A→B”與科幻小說向我們許諾的有感知的機(jī)器人,畢竟相去甚遠(yuǎn),人類的智力更是遠(yuǎn)非“A→B ”所能相比。為什么這么說?例如有一張拿著牙刷的小男孩圖片,被人工智能識(shí)別為,一個(gè)拿著棒球棍的小男孩。
這讓我們發(fā)笑,因?yàn)槲覀內(nèi)祟惤^不會(huì)這樣說。從這個(gè)例子可以看出,第二波技術(shù)在大量的工作中一次又一次地讓我們嘆服,但也會(huì)忽然間爆出這種笑料來。它所反映出來的一個(gè)結(jié)論則是,第二波人工智能在統(tǒng)計(jì)學(xué)范疇表現(xiàn)出色,但個(gè)體樣例不可靠。而這種個(gè)案的不可靠,若是發(fā)生在金融領(lǐng)域,就是災(zāi)難性的。
將“A→B”放到具體的商業(yè)環(huán)境下意味著什么?前百度首席科學(xué)家吳恩達(dá)教授用這樣一句話來解釋:一個(gè)正常普通人能夠用少于一秒鐘的思考所完成的任務(wù),都可以通過人工智能來實(shí)現(xiàn)。
第三波浪潮:
初現(xiàn)成效的語境適應(yīng)系統(tǒng)
借用美國國防高研署對(duì)第三波的定義,那就是“語境適應(yīng)”。第三波的系統(tǒng),會(huì)逐漸建造出“有意義”的模型用以描繪現(xiàn)實(shí)世界的現(xiàn)象。
舉個(gè)例子,讓第二波系統(tǒng)來甄別一張貓的圖片不是問題,但如果你問它,為什么你認(rèn)為它是一只貓呢?它的答案肯定是:“經(jīng)過大量的計(jì)算,結(jié)果顯示貓位居榜首。”這個(gè)答案顯然并不能令人滿意,我們希望它說,當(dāng)然是貓了,你看它有耳朵,有爪子,有毛,以及各種把貓與其他東西區(qū)分開來的特征呢。具備了這種知道“為什么”的能力的第三波系統(tǒng),便絕不會(huì)在把前面提到的圖片標(biāo)注為“拿棒球棍的小男孩”。
第二波系統(tǒng)對(duì)數(shù)據(jù)的依賴,幾乎達(dá)到“喪心病狂”的地步,這也是吳恩達(dá)為什么說,當(dāng)今的人工智能企業(yè)要成功,最重要的一是數(shù)據(jù),二是人才。比如你要教會(huì)一個(gè)系統(tǒng)識(shí)別一個(gè)手寫的數(shù)字,大概需要交給它5萬甚至10萬個(gè)例子,才能保證基本不出錯(cuò),設(shè)想如果你教一個(gè)小孩識(shí)字,每一個(gè)字要教5萬到10萬次是什么情景。
因此,第三波基于“語境”模型系統(tǒng)的到來便成為一件自然而然的事。
IBM的辯論機(jī)器人從海量的辯論文本中學(xué)習(xí)提取有說服力的論點(diǎn),谷歌剛剛推出的“觀點(diǎn)接口”用以在社交媒體上辨別惡意評(píng)論,都是較為成功的應(yīng)用嘗試。從前面的分析可以看出,第一波人工智能,基于嚴(yán)格的問題定義(硬編碼)而獲得了較強(qiáng)的推理能力,略有認(rèn)知,卻完全欠缺學(xué)習(xí)和抽象能力。第二波人工智能建立在統(tǒng)計(jì)模型基礎(chǔ)上,能夠進(jìn)行精準(zhǔn)分類和預(yù)測,其認(rèn)知和學(xué)習(xí)能力有了長足進(jìn)步,卻喪失了第一波技術(shù)的推理能力,同時(shí)抽象能力依然十分不足。第三波人工智能,理論上可以粗略理解為前兩波的取長補(bǔ)短,然而并非把二者相加那樣簡單。基于統(tǒng)計(jì)模型的學(xué)習(xí)和基于嚴(yán)格問題定義的專家系統(tǒng),同時(shí)存在于同一個(gè)智能系統(tǒng)這個(gè)目標(biāo),還有大量需要克服的技術(shù)實(shí)現(xiàn)以及成本問題。越仰仗人類直覺、感知的問題,對(duì)機(jī)器的挑戰(zhàn)越大。去年圣誕期間,一輛優(yōu)步無人車在舊金山當(dāng)代藝術(shù)博物館門前闖紅燈的事故,就是一例。
是不是泡沫?
答案很堅(jiān)決,不是。那怎樣解釋反復(fù)出現(xiàn)的漲潮退潮呢?又得回頭看歷史,這一次我們單獨(dú)回顧一下目前最主流的“深度學(xué)習(xí)”技術(shù)的歷史。
深度學(xué)習(xí)的變遷 深度學(xué)習(xí)經(jīng)歷了漫長而豐富的歷史,跌宕起伏的熱度,也被叫過不同的名字,每一個(gè)名字都反映了特定年代下的視角和觀點(diǎn)。
今天深度學(xué)習(xí)在很多人眼里是一個(gè)令人振奮的新技術(shù),而事實(shí)上,它的歷史可以回溯到20世紀(jì)40年代。它之所以看上去新,僅僅是因?yàn)樗诮鼛啄甑倪@股熱潮之前不被人看好,也因?yàn)樗?jīng)歷了許多不同的名字,直到最近,才定下來被叫作“深度學(xué)習(xí)”。
最早的學(xué)習(xí)算法很多是生物學(xué)習(xí)的計(jì)算模型,所以它曾經(jīng)叫作人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANNs),是實(shí)實(shí)在在基于生物大腦的啟發(fā)為基礎(chǔ)的學(xué)習(xí)系統(tǒng)。所以那個(gè)階段的“學(xué)習(xí)”概念比今天的更寬泛。
對(duì)今天的深度學(xué)習(xí)而言,神經(jīng)科學(xué)僅僅被當(dāng)作啟發(fā)和參照,已經(jīng)不再是這個(gè)領(lǐng)域的主導(dǎo)指南。因?yàn)槿缃竦目茖W(xué)對(duì)大腦的認(rèn)識(shí)依然非常有限,遠(yuǎn)不能給人工智能提供足夠的信息來進(jìn)行模擬。而媒體對(duì)輿論的誤導(dǎo)往往正源于此,它們通常會(huì)將深度學(xué)習(xí)與生物大腦聯(lián)系在一起。理解了現(xiàn)代深度學(xué)習(xí)技術(shù)除了從大腦獲得靈感外,它的技術(shù)體系還架構(gòu)在大量對(duì)線性代數(shù)、概率、博弈理論、以及數(shù)字優(yōu)化的基礎(chǔ)之上這一點(diǎn),也許將不再會(huì)被輿論所帶來的威脅論嚇倒。當(dāng)然,也不會(huì)對(duì)人工智能正在帶來的顛覆視而不見。
到了80年代,伴隨著認(rèn)知科學(xué)的興起,神經(jīng)網(wǎng)絡(luò)又熱過一次,被稱作符號(hào)推理。這期間值得一提的是一種叫聯(lián)結(jié)主義的觀點(diǎn)——大量可以進(jìn)行簡單計(jì)算的單元聯(lián)結(jié)在一起,能夠執(zhí)行智能任務(wù)。這個(gè)潮流持續(xù)到90年代中期而終止,它的“遺產(chǎn)”到了今天,在包括谷歌在內(nèi)的很多項(xiàng)目中仍然得到廣泛的應(yīng)用。
這一波原本非常有價(jià)值的研究之所以戛然而止,很大程度上是因?yàn)槟切╅_展這項(xiàng)研究的公司在尋求投資時(shí)夸大其詞,而結(jié)果并未能達(dá)到浮夸的預(yù)期,導(dǎo)致了投資者失望。
人工智能行業(yè)有一個(gè)眾所周知的事實(shí),許多自20世紀(jì)80年代起就存在的算法如今表現(xiàn)優(yōu)秀,但它們的優(yōu)秀在大約2006年之前并不明顯,原因恐怕只能用硬件開銷來解釋。當(dāng)今強(qiáng)大而廉價(jià)的計(jì)算能力、存儲(chǔ)能力彌補(bǔ)了超前優(yōu)秀算法的時(shí)代鴻溝。
大數(shù)據(jù)讓人工智能從“藝術(shù)”變?yōu)椤凹夹g(shù)” 深度學(xué)習(xí)早在50年代就出現(xiàn)了,為什么到了最近才忽然重要起來?這是一種隨機(jī)出現(xiàn)的狂熱和泡沫嗎?
其實(shí)從90年代起,它就有過不少成功的商業(yè)應(yīng)用,但人們更多地視之為“藝術(shù)”而不是“技術(shù)”。不可否認(rèn),提升深度學(xué)習(xí)算法的性能需要一些技巧,但幸運(yùn)的是,技巧的需求與訓(xùn)練數(shù)據(jù)的尺寸之間是反比關(guān)系,隨著數(shù)據(jù)量的猛增,對(duì)技巧的需求也隨之降低。
今天的學(xué)習(xí)算法在一些復(fù)雜任務(wù)的執(zhí)行能力上達(dá)到人類的水平,但這些算法本身與80年代用來解決一些小兒科問題都十分掙扎的算法幾乎一模一樣。帶來巨變的無疑是今天的海量數(shù)據(jù)。這些海量的數(shù)據(jù)來自高度聯(lián)網(wǎng)的計(jì)算機(jī),來自全社會(huì)生活的數(shù)字化,人們的每一個(gè)行為,甚至每一個(gè)步驟都被數(shù)字化后記錄了下來,這是“大數(shù)據(jù)”年代給機(jī)器學(xué)習(xí)領(lǐng)域的大禮。
人工智能商業(yè)時(shí)代需要什么
理解了眼下的人工智能所能做和不能做的,下一步便需要企業(yè)家們將這一理解貫徹到企業(yè)的策略之中,這意味著,理解價(jià)值在哪個(gè)環(huán)節(jié)產(chǎn)生,什么是難以復(fù)制的。人工智能行業(yè)是一個(gè)非常開放的領(lǐng)域,幾乎所有的頂級(jí)研究人員都沒有保留地在發(fā)表最新成果,分享經(jīng)驗(yàn)、想法以至開放源代碼。在這個(gè)開源的世界里,如下資源因而變得極其寶貴:
數(shù)據(jù) 頂尖的人工智能團(tuán)隊(duì)要復(fù)制別人的軟件,大多數(shù)不會(huì)超過一到兩年就能做到。但是要獲得別人的數(shù)據(jù)卻難于上青天。因此,數(shù)據(jù)而不是軟件,是許多企業(yè)的防御堡壘。
人才 簡單的下載,再把開源代碼應(yīng)用到你的數(shù)據(jù)上,通常很難奏效。人工智能要求對(duì)你的商業(yè)環(huán)境和數(shù)據(jù)進(jìn)行量身定制,這正是眼下硝煙彌漫的人工智能人才戰(zhàn)的起因。
至于人工智能模仿人性善惡兩極的潛能,已經(jīng)有許多的討論。然而它對(duì)于每一個(gè)個(gè)體,在未來可見時(shí)間里的最大威脅,可能還是對(duì)一部分人力工種的取代。致力于建造一個(gè)讓每一個(gè)個(gè)體都有繁榮機(jī)會(huì)的世界,是作為企業(yè)領(lǐng)袖的責(zé)任。理解人工智能可以做什么,并將它運(yùn)用到企業(yè)策略中只是一個(gè)開始,而不是結(jié)束。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.