網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

海豚語(yǔ)言被谷歌模型破譯！有AI在研究豬叫，下一個(gè)最可能是狗

2025-06-03 17:05:09　來(lái)源: 說(shuō)宇宙

云南舉報(bào)

分享至

AI產(chǎn)品越來(lái)越多，更是在迅猛發(fā)展。你有沒(méi)有想過(guò)，未來(lái)的某一天，利用AI可以讓人類(lèi)輕松的與動(dòng)物對(duì)話(huà)，也就是說(shuō)，AI將能夠聽(tīng)得懂動(dòng)物語(yǔ)言。

聽(tīng)上去有些不可思議，谷歌近日表示，他們通過(guò)大模型正在逐步破解海豚的語(yǔ)言，相信在不遠(yuǎn)的未來(lái)，人類(lèi)就能跟海豚展開(kāi)無(wú)障礙交流。

實(shí)際上，借助AI理解動(dòng)物的語(yǔ)言，近年來(lái)各國(guó)一直有研究，而且從科學(xué)和技術(shù)的角度出發(fā)，也找到了可行的方式方法。

那么，這具體是怎么操作的？AI真的能夠理解動(dòng)物的喜怒哀樂(lè)嗎？

谷歌大模型即將聽(tīng)懂海豚話(huà)？

本月14號(hào)是世界海豚日，谷歌的CEO在當(dāng)天宣布，他們推出的新的大模型接下來(lái)將實(shí)現(xiàn)和海豚的無(wú)障礙交流，未來(lái)跨物種交流將不再是夢(mèng)。

谷歌方面新推出的模型很小，據(jù)說(shuō)可以在手機(jī)上安裝運(yùn)行。至于是如何實(shí)現(xiàn)跨物種交流的，則是通過(guò)多年的聲音數(shù)據(jù)訓(xùn)練，來(lái)逐步掌握海豚發(fā)聲跟它的需求之間的關(guān)系。

從本質(zhì)上來(lái)看，這種技術(shù)邏輯并不復(fù)雜。任何一種動(dòng)物都會(huì)發(fā)出聲音，海豚也不例外。動(dòng)物發(fā)出的各種聲音也都代表了不同的情緒和需求。

谷歌跟一個(gè)名為WDP的研究機(jī)構(gòu)合作，這個(gè)機(jī)構(gòu)常年在大西洋海域研究海豚，幾十年的時(shí)間里積累了大量的視頻和音頻資料。

將這些資料和谷歌的大模型結(jié)合起來(lái)，通過(guò)分析和篩選以及運(yùn)算，就能找出發(fā)出的聲音信號(hào)之間的規(guī)律，再通過(guò)這種規(guī)律，就能逐步掌握海豚究竟在“說(shuō)”什么。

比如海豚母子相見(jiàn)，就會(huì)發(fā)出類(lèi)似于口哨的聲音。如果海豚在打架，就會(huì)發(fā)出類(lèi)似于脈沖一般的尖叫聲。如果是求偶期，則會(huì)發(fā)出嗡嗡聲。

所以說(shuō)，谷歌方面宣布的大模型能夠聽(tīng)得懂海豚的語(yǔ)言，實(shí)際上只是將過(guò)去的海量資料數(shù)據(jù)結(jié)合在了一起，通過(guò)AI的篩選以及運(yùn)算分析，掌握了海豚發(fā)聲的規(guī)律。

也可以這么說(shuō)，這是人類(lèi)多年以來(lái)收集的數(shù)據(jù)，只不過(guò)人類(lèi)的運(yùn)算分析能力有限，將這些數(shù)據(jù)交給AI，后者就能夠逐步理解動(dòng)物的叫聲代表著什么。

類(lèi)似的研究，其他國(guó)家也在推動(dòng)，而且也是借助于AI。

AI聽(tīng)得懂豬的語(yǔ)言

2022年，一個(gè)跨國(guó)研究小組推出了一款A(yù)I產(chǎn)品，主要來(lái)翻譯豬的叫聲。這個(gè)研究小組由哥本哈根大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、法國(guó)農(nóng)業(yè)研究所的科研人員組成。

研究小組推出的AI產(chǎn)品能夠聽(tīng)得懂豬的叫聲，從而分析豬的情緒。研究團(tuán)隊(duì)錄下了411頭家豬，在不同場(chǎng)景下的7000多次叫聲。

然后通過(guò)運(yùn)算分析叫聲，AI逐漸“理解”了豬發(fā)出叫聲背后的信號(hào)所代表的含義。比如，一頭豬如果很高興，呼叫聲會(huì)更短，振幅更低。如果一頭豬在生氣或者情緒低落，聲音背后的信號(hào)則正好相反。

研究人員通過(guò)進(jìn)一步的分析運(yùn)算，最終使得AI產(chǎn)品理解豬叫聲的準(zhǔn)確率達(dá)到了92%。利用這樣的產(chǎn)品，接下來(lái)養(yǎng)殖戶(hù)就能準(zhǔn)確的辨別豬的情緒是什么。

所以，還是那句話(huà)，聽(tīng)起來(lái)很復(fù)雜，但實(shí)際上這并不是什么高深的理論。只要擁有海量的動(dòng)物叫聲的樣本，分析和運(yùn)算這些叫聲，就能從中找出規(guī)律。

除了分析動(dòng)物的叫聲外，再結(jié)合動(dòng)物面部的表情，也能讓AI理解動(dòng)物在“說(shuō)什么”。

AI分析綿羊的表情

劍橋大學(xué)的研究人員此前曾利用AI來(lái)分析綿羊的面部表情，綿羊不管是痛苦還是高興，面部表情會(huì)發(fā)生顯著的改變，只不過(guò)從人類(lèi)的角度去看，難以捕捉和分析不同表情背后的含義。

AI產(chǎn)品則不一樣，其強(qiáng)大的運(yùn)算能力可以捕捉到綿羊面部表情的細(xì)微變化，將這種變化串聯(lián)起來(lái)，分析背后的規(guī)律，就能逐步掌握不同表情代表了什么樣的情緒。

科研人員給AI提供了大量的綿羊表情數(shù)據(jù)，AI分析之后逐漸標(biāo)記出了不同表情背后的細(xì)微變化，比如鼻孔的變形、耳朵的旋轉(zhuǎn)、眼睛的擴(kuò)大和縮小。這種細(xì)微的變化人類(lèi)通常捕捉和注意不到。

AI運(yùn)用算法可以掌握綿羊表情的變化，最終就能判斷綿陽(yáng)處在什么樣的狀態(tài)之下。假設(shè)這項(xiàng)技術(shù)未來(lái)和視頻監(jiān)控結(jié)合在一起，AI每時(shí)每刻監(jiān)控著綿羊，就能理解它們想要做什么。

不得不說(shuō)，借助于AI的分析，人類(lèi)就能逐步掌握動(dòng)物的喜怒哀樂(lè)，不管是聲音還是面部的表情，有些變化人類(lèi)肉眼捕捉不到。但AI是理性而高效的，它可以分析相關(guān)的數(shù)據(jù)，也能參與捕捉動(dòng)物的面部表情和聲音。

聽(tīng)抹香鯨“聊家常”

谷歌推出的大模型試圖研究海豚的語(yǔ)言，此前的一些科研人員這在一直研究抹香鯨的聲音。一個(gè)研究人員曾經(jīng)在海底旁聽(tīng)過(guò)兩只抹香鯨斷斷續(xù)續(xù)的“對(duì)話(huà)”。

這位研究人員相信，抹香鯨之間的對(duì)話(huà)就像是人類(lèi)拉家常，發(fā)出的聲音都不重樣，而且還伴隨著不同的肢體動(dòng)作。

針對(duì)抹香鯨聲音的研究，是《國(guó)家地理》近年來(lái)支持的鯨語(yǔ)翻譯計(jì)劃。科研人員通過(guò)AI處理系統(tǒng)，然后對(duì)抹香鯨發(fā)出的聲音進(jìn)行運(yùn)算分析。

AI要將抹香鯨發(fā)出的聲音與特定的背景聯(lián)系起來(lái)，然后一點(diǎn)點(diǎn)去發(fā)現(xiàn)背后的規(guī)律。這項(xiàng)研究和分析已經(jīng)持續(xù)了幾年的時(shí)間，如果下一步能夠取得突破的話(huà)，通過(guò)AI產(chǎn)品就能讓人類(lèi)和抹香鯨進(jìn)行對(duì)話(huà)。

聽(tīng)起來(lái)很樂(lè)觀，但實(shí)際上研究的工作量相當(dāng)繁重而龐大。

AI能理解到什么程度？

為了研究和分析鯨類(lèi)發(fā)出的聲音，科研人員在加勒比海海域布置了大量的水下機(jī)器人和浮標(biāo)，這些設(shè)備一年收集的鯨魚(yú)發(fā)出的聲音最多可以達(dá)到40億條。

不得不說(shuō)，光是工作量就相當(dāng)龐大。從AI的角度來(lái)看，實(shí)際上目前所有的AI產(chǎn)品并不能夠理解人類(lèi)說(shuō)話(huà)或者是動(dòng)物發(fā)聲，究竟是怎么工作的。

AI所謂的理解，只是從海量的數(shù)據(jù)中去搜尋和抓住規(guī)律，利用這些規(guī)律逐步掌握發(fā)出聲音的各種痕跡和軌跡。

在研究人員看來(lái)，目前的AI雖然還不能夠理解這些，但是通過(guò)長(zhǎng)時(shí)間的運(yùn)算分析，發(fā)現(xiàn)聲音背后的本質(zhì)和規(guī)律，以及其在不同背景下所代表的含義，實(shí)際也算是一種理解方式。

除了分析鯨類(lèi)的聲音之外，布置在海底的監(jiān)測(cè)設(shè)備，還可以將鯨魚(yú)的畫(huà)面數(shù)據(jù)源源不斷的傳遞給人類(lèi)。

AI也在不斷的識(shí)別和分析不同的鯨魚(yú)個(gè)體，通過(guò)海量的數(shù)據(jù)分析，逐漸就能發(fā)現(xiàn)誰(shuí)是誰(shuí)，以及不同的鯨魚(yú)個(gè)體之間，誰(shuí)和誰(shuí)在進(jìn)行“談話(huà)交流”。

至于AI最終的理解程度，關(guān)鍵還要看數(shù)據(jù)的多少。其實(shí)不光是針對(duì)鯨類(lèi)聲音的研究，其他動(dòng)物的發(fā)聲以及它們的動(dòng)作表情，如果進(jìn)行分析研究的話(huà)，也能掌握背后的規(guī)律。

在這個(gè)過(guò)程中，AI發(fā)揮的作用至關(guān)重要。畢竟數(shù)據(jù)太多，人類(lèi)的大腦根本分析不過(guò)來(lái)，AI可以在細(xì)微之處發(fā)現(xiàn)太多不一樣的地方，捕捉到的各種細(xì)節(jié)很可能就是最關(guān)鍵的破解。

雖然AI在研究跨物種交流的項(xiàng)目中作用很大，但在一些科學(xué)家看來(lái)，研究越是深入，AI也越可能對(duì)我們形成誤導(dǎo)。

AI發(fā)現(xiàn)的規(guī)律有可能是錯(cuò)的

倫敦瑪麗皇后大學(xué)的一位動(dòng)物學(xué)家認(rèn)為，人類(lèi)借助于AI分析和運(yùn)算動(dòng)物發(fā)出的聲音，但AI在運(yùn)算過(guò)程中可能會(huì)對(duì)我們?cè)斐烧`導(dǎo)。

這位動(dòng)物學(xué)家利用AI產(chǎn)品分析鳥(niǎo)的叫聲，用以研究鳥(niǎo)類(lèi)的發(fā)展和進(jìn)化。但是經(jīng)過(guò)長(zhǎng)期的實(shí)驗(yàn)后，他發(fā)現(xiàn)，如果人類(lèi)不進(jìn)行正確的引導(dǎo)，所有的AI模型會(huì)將許多與語(yǔ)言無(wú)關(guān)的聲學(xué)特性也糅雜到分析中。

換句話(huà)說(shuō)，如果對(duì)AI分析運(yùn)算的結(jié)果不加以甄別，研究人員最終理解的動(dòng)物叫聲可能就是南轅北轍的。

在這位動(dòng)物學(xué)家看來(lái)，研究鳥(niǎo)類(lèi)的叫聲，AI只能輔助，真正發(fā)揮作用的還得是鳥(niǎo)類(lèi)自己。動(dòng)物學(xué)家訓(xùn)練一種鳥(niǎo)雀，通過(guò)跳躍的方式來(lái)幫助科學(xué)家指出哪些鳥(niǎo)的鳴叫聲背后最為相似。

還有研究人員認(rèn)為，AI并不能解決任何生物學(xué)問(wèn)題，也不能理解真正的生物語(yǔ)言的意義，所以人類(lèi)要想解決與動(dòng)物的溝通交流，最主要的一步還是要觀察。

就像對(duì)鯨類(lèi)聲音的分析，AI可以幫助研究人員發(fā)現(xiàn)不同的規(guī)律以及不同的聲學(xué)特征。但最關(guān)鍵的問(wèn)題是，AI不能理解這些叫聲代表了啥意思，人類(lèi)同樣也不能理解。

顯而易見(jiàn)的是，目前針對(duì)各種動(dòng)物叫聲的研究，AI發(fā)揮的作用就是運(yùn)算和分析，真正起主導(dǎo)作用的還是人類(lèi)自己。

如果人類(lèi)沒(méi)有認(rèn)真的對(duì)動(dòng)物進(jìn)行觀測(cè)觀察，即便發(fā)現(xiàn)了一些聲音背后的規(guī)律，也不明白它代表著什么。

結(jié)語(yǔ)

國(guó)外的一些研究人員，希望通過(guò)AI來(lái)建立起一種跨物種、無(wú)障礙交流的互聯(lián)網(wǎng)。通過(guò)設(shè)置在野外的各種各樣的設(shè)備，可以幫助人類(lèi)與動(dòng)物進(jìn)行交流。

這樣的設(shè)想可謂野心勃勃，但顯然在短時(shí)間內(nèi)根本無(wú)法達(dá)成。不要說(shuō)野外的動(dòng)物，就是與人類(lèi)朝夕相處的貓狗，現(xiàn)在人類(lèi)對(duì)它們的叫聲也了解甚少。

所以說(shuō)，跨物種之間的交流可以有美好而遠(yuǎn)大的設(shè)想，但要完成背后的工作，恐怕不是在短時(shí)間內(nèi)就能達(dá)成的。哪怕有AI打輔助，人類(lèi)也不太可能真正聽(tīng)懂動(dòng)物說(shuō)的是什么。

聲明：取材網(wǎng)絡(luò)，謹(jǐn)慎辨別

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.