AI產(chǎn)品越來(lái)越多,更是在迅猛發(fā)展。你有沒(méi)有想過(guò),未來(lái)的某一天,利用AI可以讓人類(lèi)輕松的與動(dòng)物對(duì)話(huà),也就是說(shuō),AI將能夠聽(tīng)得懂動(dòng)物語(yǔ)言。
聽(tīng)上去有些不可思議,谷歌近日表示,他們通過(guò)大模型正在逐步破解海豚的語(yǔ)言,相信在不遠(yuǎn)的未來(lái),人類(lèi)就能跟海豚展開(kāi)無(wú)障礙交流。
實(shí)際上,借助AI理解動(dòng)物的語(yǔ)言,近年來(lái)各國(guó)一直有研究,而且從科學(xué)和技術(shù)的角度出發(fā),也找到了可行的方式方法。
那么,這具體是怎么操作的?AI真的能夠理解動(dòng)物的喜怒哀樂(lè)嗎?
谷歌大模型即將聽(tīng)懂海豚話(huà)?
本月14號(hào)是世界海豚日,谷歌的CEO在當(dāng)天宣布,他們推出的新的大模型接下來(lái)將實(shí)現(xiàn)和海豚的無(wú)障礙交流,未來(lái)跨物種交流將不再是夢(mèng)。
谷歌方面新推出的模型很小,據(jù)說(shuō)可以在手機(jī)上安裝運(yùn)行。至于是如何實(shí)現(xiàn)跨物種交流的,則是通過(guò)多年的聲音數(shù)據(jù)訓(xùn)練,來(lái)逐步掌握海豚發(fā)聲跟它的需求之間的關(guān)系。
從本質(zhì)上來(lái)看,這種技術(shù)邏輯并不復(fù)雜。任何一種動(dòng)物都會(huì)發(fā)出聲音,海豚也不例外。動(dòng)物發(fā)出的各種聲音也都代表了不同的情緒和需求。
谷歌跟一個(gè)名為WDP的研究機(jī)構(gòu)合作,這個(gè)機(jī)構(gòu)常年在大西洋海域研究海豚,幾十年的時(shí)間里積累了大量的視頻和音頻資料。
將這些資料和谷歌的大模型結(jié)合起來(lái),通過(guò)分析和篩選以及運(yùn)算,就能找出發(fā)出的聲音信號(hào)之間的規(guī)律,再通過(guò)這種規(guī)律,就能逐步掌握海豚究竟在“說(shuō)”什么。
比如海豚母子相見(jiàn),就會(huì)發(fā)出類(lèi)似于口哨的聲音。如果海豚在打架,就會(huì)發(fā)出類(lèi)似于脈沖一般的尖叫聲。如果是求偶期,則會(huì)發(fā)出嗡嗡聲。
所以說(shuō),谷歌方面宣布的大模型能夠聽(tīng)得懂海豚的語(yǔ)言,實(shí)際上只是將過(guò)去的海量資料數(shù)據(jù)結(jié)合在了一起,通過(guò)AI的篩選以及運(yùn)算分析,掌握了海豚發(fā)聲的規(guī)律。
也可以這么說(shuō),這是人類(lèi)多年以來(lái)收集的數(shù)據(jù),只不過(guò)人類(lèi)的運(yùn)算分析能力有限,將這些數(shù)據(jù)交給AI,后者就能夠逐步理解動(dòng)物的叫聲代表著什么。
類(lèi)似的研究,其他國(guó)家也在推動(dòng),而且也是借助于AI。
AI聽(tīng)得懂豬的語(yǔ)言
2022年,一個(gè)跨國(guó)研究小組推出了一款A(yù)I產(chǎn)品,主要來(lái)翻譯豬的叫聲。這個(gè)研究小組由哥本哈根大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、法國(guó)農(nóng)業(yè)研究所的科研人員組成。
研究小組推出的AI產(chǎn)品能夠聽(tīng)得懂豬的叫聲,從而分析豬的情緒。研究團(tuán)隊(duì)錄下了411頭家豬,在不同場(chǎng)景下的7000多次叫聲。
然后通過(guò)運(yùn)算分析叫聲,AI逐漸“理解”了豬發(fā)出叫聲背后的信號(hào)所代表的含義。比如,一頭豬如果很高興,呼叫聲會(huì)更短,振幅更低。如果一頭豬在生氣或者情緒低落,聲音背后的信號(hào)則正好相反。
研究人員通過(guò)進(jìn)一步的分析運(yùn)算,最終使得AI產(chǎn)品理解豬叫聲的準(zhǔn)確率達(dá)到了92%。利用這樣的產(chǎn)品,接下來(lái)養(yǎng)殖戶(hù)就能準(zhǔn)確的辨別豬的情緒是什么。
所以,還是那句話(huà),聽(tīng)起來(lái)很復(fù)雜,但實(shí)際上這并不是什么高深的理論。只要擁有海量的動(dòng)物叫聲的樣本,分析和運(yùn)算這些叫聲,就能從中找出規(guī)律。
除了分析動(dòng)物的叫聲外,再結(jié)合動(dòng)物面部的表情,也能讓AI理解動(dòng)物在“說(shuō)什么”。
AI分析綿羊的表情
劍橋大學(xué)的研究人員此前曾利用AI來(lái)分析綿羊的面部表情,綿羊不管是痛苦還是高興,面部表情會(huì)發(fā)生顯著的改變,只不過(guò)從人類(lèi)的角度去看,難以捕捉和分析不同表情背后的含義。
AI產(chǎn)品則不一樣,其強(qiáng)大的運(yùn)算能力可以捕捉到綿羊面部表情的細(xì)微變化,將這種變化串聯(lián)起來(lái),分析背后的規(guī)律,就能逐步掌握不同表情代表了什么樣的情緒。
科研人員給AI提供了大量的綿羊表情數(shù)據(jù),AI分析之后逐漸標(biāo)記出了不同表情背后的細(xì)微變化,比如鼻孔的變形、耳朵的旋轉(zhuǎn)、眼睛的擴(kuò)大和縮小。這種細(xì)微的變化人類(lèi)通常捕捉和注意不到。
AI運(yùn)用算法可以掌握綿羊表情的變化,最終就能判斷綿陽(yáng)處在什么樣的狀態(tài)之下。假設(shè)這項(xiàng)技術(shù)未來(lái)和視頻監(jiān)控結(jié)合在一起,AI每時(shí)每刻監(jiān)控著綿羊,就能理解它們想要做什么。
不得不說(shuō),借助于AI的分析,人類(lèi)就能逐步掌握動(dòng)物的喜怒哀樂(lè),不管是聲音還是面部的表情,有些變化人類(lèi)肉眼捕捉不到。但AI是理性而高效的,它可以分析相關(guān)的數(shù)據(jù),也能參與捕捉動(dòng)物的面部表情和聲音。
聽(tīng)抹香鯨“聊家常”
谷歌推出的大模型試圖研究海豚的語(yǔ)言,此前的一些科研人員這在一直研究抹香鯨的聲音。一個(gè)研究人員曾經(jīng)在海底旁聽(tīng)過(guò)兩只抹香鯨斷斷續(xù)續(xù)的“對(duì)話(huà)”。
這位研究人員相信,抹香鯨之間的對(duì)話(huà)就像是人類(lèi)拉家常,發(fā)出的聲音都不重樣,而且還伴隨著不同的肢體動(dòng)作。
針對(duì)抹香鯨聲音的研究,是《國(guó)家地理》近年來(lái)支持的鯨語(yǔ)翻譯計(jì)劃。科研人員通過(guò)AI處理系統(tǒng),然后對(duì)抹香鯨發(fā)出的聲音進(jìn)行運(yùn)算分析。
AI要將抹香鯨發(fā)出的聲音與特定的背景聯(lián)系起來(lái),然后一點(diǎn)點(diǎn)去發(fā)現(xiàn)背后的規(guī)律。這項(xiàng)研究和分析已經(jīng)持續(xù)了幾年的時(shí)間,如果下一步能夠取得突破的話(huà),通過(guò)AI產(chǎn)品就能讓人類(lèi)和抹香鯨進(jìn)行對(duì)話(huà)。
聽(tīng)起來(lái)很樂(lè)觀,但實(shí)際上研究的工作量相當(dāng)繁重而龐大。
AI能理解到什么程度?
為了研究和分析鯨類(lèi)發(fā)出的聲音,科研人員在加勒比海海域布置了大量的水下機(jī)器人和浮標(biāo),這些設(shè)備一年收集的鯨魚(yú)發(fā)出的聲音最多可以達(dá)到40億條。
不得不說(shuō),光是工作量就相當(dāng)龐大。從AI的角度來(lái)看,實(shí)際上目前所有的AI產(chǎn)品并不能夠理解人類(lèi)說(shuō)話(huà)或者是動(dòng)物發(fā)聲,究竟是怎么工作的。
AI所謂的理解,只是從海量的數(shù)據(jù)中去搜尋和抓住規(guī)律,利用這些規(guī)律逐步掌握發(fā)出聲音的各種痕跡和軌跡。
在研究人員看來(lái),目前的AI雖然還不能夠理解這些,但是通過(guò)長(zhǎng)時(shí)間的運(yùn)算分析,發(fā)現(xiàn)聲音背后的本質(zhì)和規(guī)律,以及其在不同背景下所代表的含義,實(shí)際也算是一種理解方式。
除了分析鯨類(lèi)的聲音之外,布置在海底的監(jiān)測(cè)設(shè)備,還可以將鯨魚(yú)的畫(huà)面數(shù)據(jù)源源不斷的傳遞給人類(lèi)。
AI也在不斷的識(shí)別和分析不同的鯨魚(yú)個(gè)體,通過(guò)海量的數(shù)據(jù)分析,逐漸就能發(fā)現(xiàn)誰(shuí)是誰(shuí),以及不同的鯨魚(yú)個(gè)體之間,誰(shuí)和誰(shuí)在進(jìn)行“談話(huà)交流”。
至于AI最終的理解程度,關(guān)鍵還要看數(shù)據(jù)的多少。其實(shí)不光是針對(duì)鯨類(lèi)聲音的研究,其他動(dòng)物的發(fā)聲以及它們的動(dòng)作表情,如果進(jìn)行分析研究的話(huà),也能掌握背后的規(guī)律。
在這個(gè)過(guò)程中,AI發(fā)揮的作用至關(guān)重要。畢竟數(shù)據(jù)太多,人類(lèi)的大腦根本分析不過(guò)來(lái),AI可以在細(xì)微之處發(fā)現(xiàn)太多不一樣的地方,捕捉到的各種細(xì)節(jié)很可能就是最關(guān)鍵的破解。
雖然AI在研究跨物種交流的項(xiàng)目中作用很大,但在一些科學(xué)家看來(lái),研究越是深入,AI也越可能對(duì)我們形成誤導(dǎo)。
AI發(fā)現(xiàn)的規(guī)律有可能是錯(cuò)的
倫敦瑪麗皇后大學(xué)的一位動(dòng)物學(xué)家認(rèn)為,人類(lèi)借助于AI分析和運(yùn)算動(dòng)物發(fā)出的聲音,但AI在運(yùn)算過(guò)程中可能會(huì)對(duì)我們?cè)斐烧`導(dǎo)。
這位動(dòng)物學(xué)家利用AI產(chǎn)品分析鳥(niǎo)的叫聲,用以研究鳥(niǎo)類(lèi)的發(fā)展和進(jìn)化。但是經(jīng)過(guò)長(zhǎng)期的實(shí)驗(yàn)后,他發(fā)現(xiàn),如果人類(lèi)不進(jìn)行正確的引導(dǎo),所有的AI模型會(huì)將許多與語(yǔ)言無(wú)關(guān)的聲學(xué)特性也糅雜到分析中。
換句話(huà)說(shuō),如果對(duì)AI分析運(yùn)算的結(jié)果不加以甄別,研究人員最終理解的動(dòng)物叫聲可能就是南轅北轍的。
在這位動(dòng)物學(xué)家看來(lái),研究鳥(niǎo)類(lèi)的叫聲,AI只能輔助,真正發(fā)揮作用的還得是鳥(niǎo)類(lèi)自己。動(dòng)物學(xué)家訓(xùn)練一種鳥(niǎo)雀,通過(guò)跳躍的方式來(lái)幫助科學(xué)家指出哪些鳥(niǎo)的鳴叫聲背后最為相似。
還有研究人員認(rèn)為,AI并不能解決任何生物學(xué)問(wèn)題,也不能理解真正的生物語(yǔ)言的意義,所以人類(lèi)要想解決與動(dòng)物的溝通交流,最主要的一步還是要觀察。
就像對(duì)鯨類(lèi)聲音的分析,AI可以幫助研究人員發(fā)現(xiàn)不同的規(guī)律以及不同的聲學(xué)特征。但最關(guān)鍵的問(wèn)題是,AI不能理解這些叫聲代表了啥意思,人類(lèi)同樣也不能理解。
顯而易見(jiàn)的是,目前針對(duì)各種動(dòng)物叫聲的研究,AI發(fā)揮的作用就是運(yùn)算和分析,真正起主導(dǎo)作用的還是人類(lèi)自己。
如果人類(lèi)沒(méi)有認(rèn)真的對(duì)動(dòng)物進(jìn)行觀測(cè)觀察,即便發(fā)現(xiàn)了一些聲音背后的規(guī)律,也不明白它代表著什么。
結(jié)語(yǔ)
國(guó)外的一些研究人員,希望通過(guò)AI來(lái)建立起一種跨物種、無(wú)障礙交流的互聯(lián)網(wǎng)。通過(guò)設(shè)置在野外的各種各樣的設(shè)備,可以幫助人類(lèi)與動(dòng)物進(jìn)行交流。
這樣的設(shè)想可謂野心勃勃,但顯然在短時(shí)間內(nèi)根本無(wú)法達(dá)成。不要說(shuō)野外的動(dòng)物,就是與人類(lèi)朝夕相處的貓狗,現(xiàn)在人類(lèi)對(duì)它們的叫聲也了解甚少。
所以說(shuō),跨物種之間的交流可以有美好而遠(yuǎn)大的設(shè)想,但要完成背后的工作,恐怕不是在短時(shí)間內(nèi)就能達(dá)成的。哪怕有AI打輔助,人類(lèi)也不太可能真正聽(tīng)懂動(dòng)物說(shuō)的是什么。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.