跨物種交流的愿景
2005年,在谷歌尚未退出中國大陸時,百度曾喊出:百度更懂中文”。再后來,在2017年的百度世界大會上,李彥宏說百度要從“更懂中文,變成“百度更懂你”。八年后,百度可能要說“更懂動物了”。
五一長假之后,媒體通過天眼查App了解到,百度剛剛申請了一項專利,內容是“動物語言轉換方法、裝置、電子設備及存儲介質”。
把這項專利內容翻譯成大白話大概是這樣的:百度通過記錄貓狗等動物的聲音、行為和體征,將其生成一套多模態數據系統,據此再對動物情緒進行識別,同時翻譯成人類語言輸出。
百度專利稱,該技術能夠實現動物與人類之間更深層次的情感交流和理解,提高了跨物種溝通的準確性和效率。
刷到這則新聞時,我正好和一位養貓的朋友在一起,我問他家里貓叫的時候,能知道它想干什么,他說貓基本上只有有事的時候才會叫,但他無法把某種具體的貓叫聲和貓的意圖進行準確對應。
貓狗情緒研究原理
在百度公布這項專利前的一個月,印度普拉迪卡蘭拉姆克里希納·莫爾學院的兩位學者維賈伊·蘇尼爾·賈達夫和桑托什·賈格特,發表了一篇論文,內容和百度專利非常相似:“利用人工智能進行動物面部檢測以理解其情緒和行為”。
這篇論文回顧了過往AI學者對動物表情的代表性研究:
一項涉及狗面部表情的案例研究中,數據集訓練卷積神經網絡(CNN)在一萬張圖像的數據集上進行訓練。該模型在區分快樂、恐懼和中性表情方面達到了88%的準確率,核心貢獻是發現狗狗獨特的特征,如耳朵的位置、口型和眼睛睜開程度,是情緒狀態的關鍵指標。
另一項研究則把類似的方法被應用于貓,在5000張貓咪面部表情圖像上進行訓練,但確率比狗要略低,為80%,表明貓科動物的表達面臨特殊挑戰。貓的情緒狀態受到外界刺激的影響比狗要大,使數據收集變得復雜。此外,貓在面部表情上表現出微妙的變化,使得檢測更具挑戰性。
這兩項研究證實了許多人的猜測:無論貓還是狗,它們的表情中都能反應情緒。狗可以表現出快樂,恐懼,焦慮,甚至嫉妒的跡象。認識到這些情緒可以提高訓練和行為矯正技術。貓的表情比狗要復雜,但結合肢體語言,你也能窺探到它們的快樂、沮喪和壓力這些內心戲。
從人臉識別到讀心術
當前的AI技術對人臉和情緒識別準確率已經趨于成熟,通過分析語音的音調、語速、音量、停頓等特征,AI可以較為準確地判斷說話者的情緒(如憤怒、快樂、悲傷、驚訝等)。在標準數據集上,準確率可達70%以上;利用計算機視覺技術,分析面部肌肉運動,如微笑、皺眉、瞪眼等,情緒判斷的準確率在理想條件下可達90%以上。
最前沿的情緒識別系統往往融合語音、圖像、文本和生理信號等多種數據源,并且已進入實用化階段,廣泛應用于智能客服、健康醫療、車載安全、教育娛樂等領域。
人類情緒識別技術已經開始進入商用,智能手表、健康手環等可監測用戶生理信號,分析壓力、焦慮、愉悅等情緒狀態,提供健康建議;微軟通過Microsoft Azure Emotion API提供基于云的面部表情識別服務;初創公司Affectiva(已被Smart Eye收購)則專注于車載和廣告領域的情緒識別。Amazon Alexa阿里小蜜、百度度秘等語音助手均集成了情緒識別模塊。
但考慮到用戶隱私和倫理的問題,基于人類面部特征的商業化短期不太可能走得太遠。
2020年,有中小學引入AI攝像頭監測學生上課表情、情緒,家長和社會質疑侵犯學生隱私、加劇心理壓力,最終被叫停,教育部等部門明確要求規范AI在校園的應用,保護未成年人權益。2022年,部分企業、法院試點用AI分析面試者、被告情緒,媒體和專家質疑科學性和倫理風險。
海外大廠早已布局動物情緒研究
把對人情緒識別能力復用到動物身上,只是時間問題。百度并非先行者。亞馬遜、谷歌、PetPace、Petronics等公司早在好幾年前,就曾申請過與動物聲音識別、情感分析相關的專利。
谷歌在2017年就申請了一項與動物情緒識別相關的專利,該專利提出了一種利用傳感器和機器學習技術,對動物的情緒和健康狀態進行分析的方法和系統。谷歌的專利推動了動物情緒識別領域的技術發展,相關思路和方法被PetPace、Whistle等寵物科技公司借鑒和應用。
亞馬遜在2020年提交的專利,通過通過攝像頭、麥克風、可穿戴設備收集動物的聲音、面部表情、身體姿態等多模態數據,結合AI算法識別動物的快樂、焦慮、疼痛等情緒,并通過語音助手或顯示屏向人類用戶傳達的系統。通過語音合成或文本方式將動物的“情感”翻譯成人類語言。
但這對動物的情緒研究還處于非常初級的階段。
最大挑戰在于,人類和動物的情緒表達方式差異巨大。動物的情緒表達方式高度依賴物種、品種、個體,缺乏統一的“表情語言”,如狗的搖尾巴、貓的呼嚕、馬的耳朵動作等,難以直接類比人類。而在不同動物之間,生理結構、行為習慣、情緒表達方式差異極大,模型泛化能力有限。
另一個直接原因則是缺乏高質量標注數據,人類情緒有大量公開數據集(如FER、IEMOCAP等),而動物情緒數據集稀缺,且標注主觀性強,依賴專家經驗。人類情緒有“快樂、憤怒、悲傷”等標準標簽,動物的“情緒”更多是行為狀態(如警覺、放松、攻擊、求偶等),難以一一對應。
寵物經濟,想象的藍海
過去,研究動物表情的主要是獸醫,主要為了方便給動物看病和行為矯正。那么,現在當谷歌、亞馬遜、微軟、百度等科技公司來關心動物表情,他們的用意何在?
最大的推動因素還是商業利益驅動。據Global Market Insight發布的報告,早在2022年全球寵物市場規模已達到2610億美元。
在中國,寵物增長的曲線卻是昂揚向上。據《2025年中國寵物行業白皮書》顯示,2024年中國寵物數量超1.2億只,已經超過4歲以下的嬰兒數量,城鎮(犬貓)消費市場規模突破3000億元。
無論對于歐美的存量市場,還是中國的增量市場,人類情緒識別、健康監測等AI技術日趨成熟,向動物領域遷移成為必然。
物主對寵物健康、情感、陪伴的關注度大幅提升,寵物主希望更好地“理解”寵物,減少誤解和焦慮,提升陪伴體驗。科技公司通過情緒識別技術,幫助用戶與寵物建立更深層次的情感紐帶,情緒識別也能成為差異化賣點。
就像推進生成式AI一樣,在寵物情緒識別上,百度在國內再一次起了大早。但是不是能趕上大集?從當前的情況看,包括情緒識別在內的寵物市場可能并沒有想象的那樣大。
在口罩期間,隨著經濟下滑,美國、英國等國也出現了寵物數量下滑。所以,以“用戶數”來計算,全球的家養寵物數量可能已經處于頂峰,跟當前互聯網用戶數增長見頂類似。
從市場規模看,寵物經濟只是諸多垂直賽道之一,當前全球2600億美元的規模,只是汽車、醫療、食品這樣的大行業的十分之一甚至更小的零頭,但與又與全球白色家電、網絡游戲規模相當,整體上看屬于規模中等偏上的行業。
寵物經濟也是典型的順周期行業,其基礎是養寵家庭數量和人均寵物消費,當經濟下行、收入減少時,寵物消費易被削減。歐美等成熟市場養寵滲透率已達60-70%,中國等新興市場雖有提升空間,但最終也會趨于穩定。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.