文/VR陀螺 元橋
2025,AI智能眼鏡仍在持續增長。
據陀螺研究院數據顯示,預計2025年全球AI眼鏡出貨量或將超過500萬臺,市場規模超百億。不僅市場高速增長,廠商們也打的熱火朝天,科技大廠以及華強北們都在加速入局。
在市場一片欣欣向榮的發展局面下,業內均在尋找新的應用場景。在翻譯、拍攝、錄像、導航等應用之外,Meta、索尼以及一些其他海外企業紛紛盯上了這個細分市場,即探索為視障人士提供AI眼鏡。
對比日常用戶而言,或許現階段這類群體對AI眼鏡的需求顯得更為迫切。
視界之外:Meta嘗試,索尼關注
視障是個很特殊的群體,相對來說被關注度并不高,但業內卻一直有企業在做。
2012年,漢斯·約根·維伯格便萌生出了針對視障群體創造一個免費應用軟件的想法,之后Be My Eyes就此誕生。如今,Be My Eyes已有超過72萬盲人注冊,超過770萬名志愿者注冊,分別來自150多個國家,組成了全球最大的數字視障志愿者組織。
但Be My Eyes上的盲人注冊數量相對于全球視障群體數量還只是冰山一角,隨著技術的發展,Be My Eyes也在不斷擴大。去年,Be My Eyes開始與Meta合作,嘗試在AI眼鏡上增加輔助功能。Meta在其Connect 2024大會上也正式發布了為Rayban帶來的一系列更新,其中就包括「Be my eyes」的互助類App,用來讓眼鏡給低視力患者充當義眼,將眼鏡所拍攝到的眼前數據實時上傳,并由其他視力正常的志愿者幫助使用者感知日常世界。
據雙方表示,佩戴AI眼鏡,用戶可以完全通過語音指令啟動《Be My Eyes》的呼叫志愿者功能,例如呼叫“嘿,Meta”在《Be My Eyes》上用戶就能通過單向視頻、雙向音頻呼叫,與語言匹配的志愿者取得聯系。
不僅升級了輔助類新功能,Meta也表示“正在努力構建能夠真正反映全球近40億用戶多樣性的技術,我們與《Be My Eyes》的合作是朝著讓世界對盲人或低視力者更加包容和提供更多無障礙服務邁出的重要一步。”顯然Meta的想法已經很明顯了,AI智能眼鏡不僅僅是日常用戶的智能,還將會是更多人的智能。
不僅僅Meta開始探索這條道路,今年索尼印度公司也開始向視障群體分發了智能眼鏡,涉及了印度的21個城市。據稱該款智能視覺眼鏡采用了AI和激光雷達 (LIDAR) 技術,旨在幫助視障人士導航周圍環境、探測障礙物、閱讀多種語言的印刷和數字文本以及使用緊急援助功能。但從已透露的信息來看,該款眼鏡大多數功能仍需要借助手機輔助,技術上并沒有特別之處。只是索尼的關注,也為市場注入了新力量。
除了知名企業之外,去年,醫療科技初創公司Cornel Amariei也推出了一款導盲AI眼鏡lumen Glasses。據稱,lumen眼鏡基于行人自主駕駛(PAD AI)技術,配備了6個高清攝像頭和紅外感應功能,能夠全方位感知周圍環境。除了導航功能外,Lumen Glasses還支持語音指令控制。用戶只需說出需要到達的目的地,眼鏡就能自動規劃出最優路線,并通過語音提示和觸覺反饋引導用戶前行。
今年,基于AI眼鏡形態,上海交大盲人導航研發也取得了新的進展。該研究開發了一款面向盲人和部分視力障礙者的可穿戴多模態視覺輔助系統,該系統利用AI,解讀安裝在眼鏡上的攝像頭所拍攝的畫面,在佩戴者接近障礙物或物體時會通過骨傳導耳機進行語音提示,以及通過貼在手腕的可伸展「人造皮膚」進行震動提醒,指導佩戴者移動方向,避開兩側的物體,為其選擇一條無障礙路線。
為了驗證該系統的效果,研究團隊還招募了20名盲人或部分視力障礙者進行測試。在室內迷宮測試中,12名參與者能夠在室內迷宮中避開障礙物。在真實世界測試中,8名參與者能夠在城市街道上行走以及穿過擺滿家具的會議室。雖然目前該裝置還只是一個原型機,但所展現的能力,在實際應用中具有很大的潛力。
據世界衛生組織(WHO)5月12日發布的《世界視力報告》顯示,全球約有22億人患有視力障礙,其中約10億人的視力障礙問題可以通過現有解決方案得到解決。而中國是全球視障人數最多的國家。截至2023年,我國有超過1700萬視力障礙人士,占全球視障人口約18%「按照每人平均花費2000元購買導盲產品測算,市場規模將超300億」。當然,這僅是粗略的估算,實際市場規模會受到諸多因素的影響。
需求之下,視聽輔助類智能眼鏡的困境
視障人群對于AI眼鏡的需求很簡單,現階段硬性的技術基本可以實現,難做的則是軟性層面,真正解決視障人群的實際需求。
其實,在Apple Vision Pro與Ray-Ban Meta發布之后,就已經有不少視障群體開始體驗此類智能產品,但也由于無針對性應用使用起來也存在諸多不便。而對于視障群體來說,現階段的智能眼鏡功能也都相對繁瑣,如果讓視障的用戶去摸索使用,第一關就存在很大的問題。
因此,做好此類產品往往細節處理是很容易被忽視的問題。同時更為重要的是,技術問題之外,此類產品的推進也依賴公司對這個群體的理解程度以及平衡利益的能力。以疫情期間視障群體搶購物資為例,很多有視力障礙的人在搶購商品時發現,在通過聽商品頁面信息去購物時,許多商品的介紹圖片就攔住了他們順利進入下一步的選擇。很多細小的問題,如選擇配送時間或者多買幾份,能夠順利摸到勾選的那一步都很難。可以理解的是,如果視聽類智能眼鏡想進一步得到普及,還需要社會的共同推動。
即便拋開社會層面不談,對于智能眼鏡來說也存在很多細化的處理工作,例如視障與聽障對產品的需求也有很大的不同。
美國硅谷智能硬件公司Vigo Telenologies創始人告訴VR陀螺,“對于聽障人群來說,產品一定要具備定向拾音的麥克風,一般可以用到兩到三個,通過定向拾音的算法盡量捕捉前面的人說話,并且過濾掉雜音。而其他產品在做降噪時更多傾向于過濾環境音而非人聲。還有一點,聽障人群要看的不僅僅是文字的轉寫,有很多聲音比如火警、孩子在哭、微波爐「叮」的一聲、洗衣機洗完的提示音,這些聲音其實都要做識別,這些場景要做很多細化的工作。”
此外,對于聽障人士而言,還有很多老年人患有老花,目前市場上的AR眼鏡的的顯示字體也大多都滿足不了他們的需求,字體這方面也需要專門的做優化。
Vigo Telenologies創始人還表示,“目前所有的AR眼鏡基本上都會把焦距定在大概4米的范圍,但對于聽障人群來講有些不一樣,例如兩個人聊天相距一米,聽講座距離演講者有5米,看電影坐在最后一排可能距離有20米。如果AR眼鏡焦距是固定的,那么用戶需要在人臉跟文字間來回對焦,這個體驗很不好。因此我們的眼鏡通過一些思路實現了從1米到無限遠的變焦,只有這樣才能最好的去服務這個群體。”
總體來看,針對視障人士的智能眼鏡開發,往往需要的可能并不是什么新功能,而是讓用戶在操作每個功能時,能夠真正感受到實際的用處。另外需要注意的是,目前很多產品的善意開發,往往是建立在健全人對視障人士的誤解之上,反而強化了公眾對此類群體的刻板印象。
結語
讓技術看見視障/聽障人士,用技術的溫度去消除正常人與他們之間的隔離墻,或許是我們最想看到的畫面。智能眼鏡能在此處落腳,也是關注到了這部分的小群體。
但還是那句話,雖然關注到了,難的卻是軟性層面的設計。當一家企業開始踏向這個方向時,往往意味著要權衡多方的利益,當商業回報與付出無法形成正比時,很多項目都很難堅持下去。同時,開發此類產品對廠商理解這一群人提出了很高的要求,如何理解他們也決定了能為他們創造出怎樣的產品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.