智東西
作者|陳駿達(dá)
編輯|云鵬
智東西7月26日?qǐng)?bào)道,今天下午,阿里巴巴發(fā)布了其首款自研AI眼鏡——夸克AI眼鏡的技術(shù)研發(fā)進(jìn)展。據(jù)悉,阿里巴巴AI眼鏡已完成研發(fā),預(yù)計(jì)將于年內(nèi)正式發(fā)布。
智東西也在WAIC大會(huì)上發(fā)來(lái)夸克AI眼鏡的實(shí)拍圖,其采用雙光機(jī)顯示設(shè)計(jì),鏡腿前部相較其他AI眼鏡更為纖細(xì),大部分組件被放到了鏡腿末端,
▲夸克AI眼鏡實(shí)拍圖(圖源:智東西)
這一AI眼鏡將與阿里及支付寶生態(tài)融合,可使用支付寶“看一下支付”,具備通義千問(wèn)大模型、夸克最新AI能力,還支持高德導(dǎo)航、淘寶比價(jià)、點(diǎn)外賣、飛豬商旅提醒等功能。
阿里巴巴智能信息事業(yè)群終端業(yè)務(wù)負(fù)責(zé)人宋剛稱,夸克AI眼鏡搭載了高通驍龍AR1芯片+低功耗協(xié)處理器的雙芯設(shè)計(jì)以及安卓+RTOS雙系統(tǒng),實(shí)現(xiàn)動(dòng)態(tài)的資源調(diào)度;另一方面,其使用了可換電的雙電池系統(tǒng),用戶可通過(guò)熱插拔主電池實(shí)現(xiàn)24小時(shí)續(xù)航。
夸克AI眼鏡支持調(diào)整合像距,避免了單光機(jī)方案帶來(lái)的眼疲勞問(wèn)題。其鏡腿采用鈦合金材料一體成型,保證輕量化。
一、換電倉(cāng)僅有“耳機(jī)殼”大小,鏡框鏡腿重量比為1 : 1
宋剛在今天下午的WAIC人工智能終端產(chǎn)業(yè)發(fā)展論壇上分享了夸克AI眼鏡的更多研發(fā)細(xì)節(jié)和參數(shù)。
他稱,阿里巴巴認(rèn)為,AI眼鏡會(huì)是穿戴智能方向最重要的產(chǎn)品形態(tài),頭部設(shè)備可以捕獲80%以上的人體感知輸入,具有極強(qiáng)的場(chǎng)景穿透力,能同時(shí)覆蓋辦公、生活以及移動(dòng)場(chǎng)景。AI眼鏡有望成為繼智能手機(jī)之后最重要的個(gè)人移動(dòng)入口。
當(dāng)前,AI眼鏡尚未走到普及階段,面臨的主要問(wèn)題包括不夠智能、續(xù)航時(shí)間短、不夠美觀舒適等。為解決上述問(wèn)題,研發(fā)團(tuán)隊(duì)不僅為夸克AI眼鏡配備常規(guī)AI眼鏡所支持的音樂(lè)、電話、翻譯、紀(jì)要等功能,還增加了多種新配置和功能。
硬件層面,阿里首先通過(guò)定制雙音圈大振膜的小型化揚(yáng)聲器、定制一體化FTC排線、鈦合金一體化成型鏡腿讓眼鏡進(jìn)一步輕量化,同時(shí)保證功能。
其鏡片也采用定制方案,擁有高折射率和鍍膜工藝,觀感上更為通透,也讓鏡框能做到更窄、更薄。
設(shè)計(jì)鼻托和耳彎接觸面時(shí),夸克AI眼鏡采用了仿生曲面的設(shè)計(jì),實(shí)現(xiàn)壓力均勻分布。同時(shí)將設(shè)備重心精準(zhǔn)的控制在眼鏡幾何中心的位置,鏡腿、鏡框配重比為1 : 1,據(jù)說(shuō)能提升佩戴的平衡感。
芯片方面,宋剛稱,高通驍龍AR1和低功耗協(xié)處理器的方案,可以提升重度負(fù)載場(chǎng)景的功效,也能降低待機(jī)場(chǎng)景的功耗。
示意圖顯示,支持更換的主電池位于右側(cè)鏡腿,另一側(cè)有一個(gè)更小的內(nèi)置電池,這讓這款眼鏡具備了電池?zé)岵灏文芰ΑK蝿傉f(shuō),換電倉(cāng)可隨身攜帶,大小和無(wú)線耳機(jī)盒差不多大,幫助這款眼鏡實(shí)現(xiàn)24小時(shí)續(xù)航。
二、拍攝算法針對(duì)暗光場(chǎng)景優(yōu)化,擁有自研大模型中控系統(tǒng)
宋剛認(rèn)為,AI眼鏡行業(yè)在拍攝上最大的痛點(diǎn)就是在暗光下噪點(diǎn)偏高,動(dòng)態(tài)范圍不足,成片率低。為解決這一問(wèn)題,夸克AI眼鏡使用了自研的Super Raw超級(jí)暗光增強(qiáng)功能,可實(shí)現(xiàn)RAW域多幀融合以及自適應(yīng)降噪。
還有不少AI眼鏡因拍攝畫質(zhì)不佳、畫面抖動(dòng)等問(wèn)題而飽受詬病。對(duì)此,夸克AI眼鏡的解決方案是借助陀螺儀檢測(cè)線性角速度,進(jìn)行實(shí)時(shí)運(yùn)算處理,對(duì)抖動(dòng)畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償,實(shí)現(xiàn)防抖。
眼鏡拍攝的畫面還會(huì)與云端的AI超分插幀算法融合,最終實(shí)現(xiàn)4K、60幀的拍攝效果。
顯示方面,夸克AI眼鏡調(diào)整了顯示區(qū)域的位置,最終確定了避開(kāi)主視區(qū)的視仰角,能在保證觀看舒適的前提下,盡量減小對(duì)現(xiàn)實(shí)世界的干擾。
夸克AI眼鏡還擁有專門定制的字體,適合近眼顯示,保障了顯示的識(shí)別度,同時(shí)提升了視覺(jué)舒適性,可滿足用戶在翻譯、導(dǎo)航等場(chǎng)景的使用體驗(yàn)。
AI眼鏡主要的交互方式是語(yǔ)音,因此眼鏡能否聽(tīng)得清用戶的聲音十分重要。夸克AI眼鏡配備了5個(gè)麥克風(fēng)加1個(gè)骨傳導(dǎo)陣列設(shè)計(jì),在噪聲環(huán)境下也可以較為準(zhǔn)確地喚醒。用于識(shí)別、理解語(yǔ)音指令的是夸克語(yǔ)音大模型,支持口音、方言識(shí)別。
以導(dǎo)航場(chǎng)景為例,夸克AI眼鏡研發(fā)團(tuán)隊(duì)聯(lián)合高德地圖開(kāi)發(fā)了適配AI眼鏡的近眼顯示導(dǎo)航系統(tǒng),可實(shí)現(xiàn)在騎行、步行等移動(dòng)場(chǎng)景下的導(dǎo)航功能。
該團(tuán)隊(duì)還自研了Master Agent大模型中控系統(tǒng),可以自主分解復(fù)雜指令,實(shí)現(xiàn)多意圖、多輪對(duì)話。
在支付場(chǎng)景,雖然夸克AI眼鏡的“支付寶看一下”支付方案具體細(xì)節(jié)尚未公布,但是同款方案已經(jīng)落地到Rokid、小米、雷鳥(niǎo)等品牌的AI眼鏡,可通過(guò)攝像頭掃碼,語(yǔ)音指定支付金額、確認(rèn)支付等。
AI圖像問(wèn)答方面,除了使用AI圖像增強(qiáng)技術(shù)讓眼鏡“看得清”之外,夸克AI眼鏡擁有定制意圖識(shí)別模型,這一模型讓系統(tǒng)端到端耗時(shí)較行業(yè)平均水平優(yōu)化了36%。夸克多模態(tài)大模型負(fù)責(zé)最終的回答,擁有百億級(jí)的圖像檢索能力。此外,夸克的視覺(jué)問(wèn)答能力、學(xué)習(xí)辦公能力都將提供原生適配。
宋剛稱,除了融合阿里巴巴自有生態(tài),夸克AI眼鏡將會(huì)聯(lián)合全球領(lǐng)先的眼鏡品牌,通過(guò)技術(shù)、渠道、服務(wù)以及C2M定制能力的整合,進(jìn)一步提升用戶體驗(yàn)。
結(jié)語(yǔ):國(guó)內(nèi)大廠爭(zhēng)相入局,百鏡大戰(zhàn)迎重大變量
2025年,隨著配套供應(yīng)鏈的成熟和AI模型能力的提升,AI眼鏡產(chǎn)品迎來(lái)集中爆發(fā)。近期,隨著阿里、小米等巨頭的入局,百鏡大戰(zhàn)又迎來(lái)新的重大變量。
阿里正基于Qwen系列模型向Rokid、雷鳥(niǎo)創(chuàng)新等AI眼鏡頭部企業(yè)提供AI能力支持,并在上述合作中探索了將支付寶、高德等阿里生態(tài)中的應(yīng)用與AI眼鏡結(jié)合的方式。同時(shí),阿里自身也具備研發(fā)天貓精靈等智能終端的經(jīng)驗(yàn)。
不過(guò),這些技術(shù)積累能否成功轉(zhuǎn)化為爆款產(chǎn)品,仍有待市場(chǎng)的驗(yàn)證。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.