2024年的尾聲,Siri突然從雞肋變成了香餑餑。
在大模型技術、AI智能體(AI Agent)飛速發展帶動下,搭載端側大模型的AI手機正成為各大硬件手機廠商的兵家必爭之地。
今年四季度,國外的蘋果、三星,國內的榮耀、小米、VIVO、OPPO等紛紛發布了新款AI手機。其中,Siri這樣的手機智能助手很有可能成為新一代“超級流量入口”。
在手機廠商設計的未來藍圖中,用戶只需要跟手機智能助手聊天,就能美化照片,甚至可以直接點外賣、打車、購物,Siri們化身為AI“指揮官”,擁有在手機后臺調用各類軟件APP的權限。
但是,現實或許沒有那么美。
圖片由AI生成
01
AI手機大競賽
2024年9月,蘋果首款“AI iPhone”iPhone 16發布,首次將大模型部署在手機內存中,正式拉開了AI手機競賽的大幕。
在這之前,榮耀CEO趙明就曾預告過Magic7系列,并表示這將是首款中國消費者可以體驗AI Agent的手機,“領先蘋果”。與前東家華為“遙遙領先”的口號如出一轍。
10月,榮耀發布了Magic OS 9.0 ,這款手機使用AI OS,“YOYO智慧助手已經打通了多款APP,可以實現一句話充值、一句話點外賣等服務。”
在業內,榮耀被認為是將AI端側大模型落地“最早且最徹底”的廠商。
一度榮耀承接了華為手機丟掉的市場份額,并快速登頂國內手機市場。但隨著華為的回歸,榮耀需要承受的競爭壓力也越來越大。
2024年榮耀接連完成了多輪IPO前的重要融資。在與華為分手四年后,擺在榮耀面前的,一邊是上市前的業績壓力,另一邊是前東家從扶持變競爭的尷尬境地,能否憑借AI手機重振銷量,可謂關鍵一戰,“欲成華為,挑戰蘋果”更成了榮耀的新目標。
對AI手機寄予厚望的顯然不只榮耀一家。
同樣是在10月,小米、vivo、OPPO走馬觀花式地推出了各自的AI手機,端側大模型的浪潮洶涌而至。
其中,小米發布了搭載澎湃OS 2的小米15,升級“小愛”為“超級小愛”,支持AI動態壁紙、AI鎖屏、AI寫作、AI識音、AI字幕、AI妙畫等功能。
vivo發布了30億參數量級的藍心端側大模型3B,同時也公布了自家其他類型的大模型(語音、圖像、多模態)的升級,號稱6年來,vivo在AI方面的投入,累計超過230億元。
OPPO則宣布實現了全球首次MoE(混合專家模型)在端側的落地,提出了AI即系統(AI as System)的口號,“小布”智能助手支持超1800項指令。
魅族更是在今年2月,提出“All in AI”的戰略,并停止了傳統智能手機新項目,全面發力AI手機。
相對比蘋果和三星,國產手機廠商全面擁抱AI的態度甚至更為激進,速度可謂敏捷。
從另一個重要內驅因素來看,各家廠商都急需要找到新的故事和增長點。數據顯示,在中國市場,2017年智能手機出貨量接近5億部,到了2023年出貨量已不足3億部,市場萎縮近40%,消費者的換機周期也從一年半延長到兩年半至三年半。
02
端側AI性能之憂
眾所周知,大模型運行需要芯片、算力、帶寬等等硬條件支持,端側大模型又是如何在一臺小小的手機上實現智能化的呢?
我們先來看一下國內外領先的大模型廠商的技術參數——
ChatGPT的締造者OpenAI去年夸耀稱,其GPT-4模型擁有約2萬億個參數。
12月18日火山引擎官宣豆包大模型發布以來,在7個月時間里,日均tokens增長超過33倍,日均tokens使用量超過4萬億。
參數表示AI模型的大小,一般參數越多,AI模型的能力越強。相對比端側大模型,ChatGPT、豆包等應用背后的大模型都布局在云端。
手機天然受制于終端設備處理器算力、內存、存儲容量,以及電池續航等各方面技術限制,與云端大模型動輒成千上萬億的參數相比,端側大模型幾十億、哪怕上百億的參數,顯然不在一個量級上。
另一方面,手機廠家發展端側大模型,勢必要求終端設備硬件配置升級,這很有可能大幅推高消費者的購機成本,或以其他方式轉嫁給相關廠商。業內普遍認為,從能耗方面看,電池密度更是短期最難突破的硬件短板。
實際上,目前許多AI手機雖然對外主打自家的端側大模型,但實際上是搭配了云端大模型的混合式AI路線。例如旗艦手機X100上,vivo將在終端還是云端運行大模型的選擇權留給了用戶,默認選項是在云端跑。
蘋果雖然也有自家的AI能力,但也依然選擇與更強大的大模型廠家合作。近期,蘋果將與字節、騰訊開展大模型合作的新聞喧囂塵上。而海外X社交平臺上,就有博主在iOS18.1推出后直言不諱:“我們一直在等待的蘋果智能充其量只是谷歌和 ChatGPT 上的一個漂亮的用戶界面。”直指蘋果AI手機是套殼的AI。
03
APP廠家無障礙后門恐遭“盜用”
AI手機端側大模型除了上述生成內容等AI能力之外,更重要的一個賣點在于,可以用自家的智能助手“指揮官”調用手機上的各類應用程序,以用戶的語音指令為導向,一次性、全自動地完成過往需要多次點擊才能完成的操作。
業內人士透露,“在這一輪AI競賽中,手機廠商大已發展出兩大技術路線,一種是‘簽訂意圖框架’,另一種是‘模擬用戶識屏+模擬點擊’操作”。
所謂“簽訂意圖框架”模式,主要依靠手機廠商的品牌能力,邀請盡可能多的第三方App軟件廠商加入,共建生態。
這種模式對手機品牌號召力和生態影響力要求較高,目前業內主要是蘋果和華為選擇了這種模式。
而所謂“模擬用戶識屏+模擬點擊”模式,是以AI能力識別屏幕,并理解、分析屏幕內容,同時訓練一套成熟的模擬點擊各類APP的操作腳本。
例如,用戶如果要點外賣,智能助手就會讓手機系統理解這一指令,并直接在后臺“打開某外賣軟件APP、打開選餐頁面”,繞過第三方App授權,操作其內部功能。
目前榮耀等國產安卓手機多采取“模擬識屏+模擬點擊”操作模式。
值得注意的是,“模擬識屏和點擊模式中,有些國產手機直接利用安卓系統為殘障人士開發的后門‘無障礙權限’,強行調用第三方APP應用的授權,這里面存在極高的安全、隱私和合規風險。”上述人士稱。
如果說手機廠商與三方APP的關系就好比商場物業與門店商戶,目前行業通用的API授權機制則類似于各家門店的鑰匙,物業需要在獲得門店商戶允許后才可以開門。但AI手機目前的發展模式,則是在沒有鑰匙的情況下強行調用各家APP的服務功能,這相當于商場物業直接撬開商戶店門,對外出售店內的產品與服務。
無論上述哪一種模式,手機廠商與軟件APP生態的關系,乃至整個行業的競爭秩序都正在受到挑戰。
AI手機廠商的競賽難免,但野蠻式、掠奪式的競賽或難長久。
04
用戶隱私新悖論
近一年來,為了宣傳新手機,許多手機廠商高管都對外宣傳——端側大模型因為把AI運行在手機硬件里,會讓用戶數據和隱私變得更為安全。
但這可能成為一個新的悖論。
如上,無論是通過和APP軟件開發者簽訂意圖框架,還是濫用無障礙權、模擬用戶識屏+模擬點擊操作,用戶數據一旦授權給端側大模型,智能助手們將擁有最大的訪問用戶數據的權限。
業內人士擔憂,當前AI手機對應用和服務的讀取模式下,勢必會出現大量模糊地帶,用戶數據安全和隱私保護將成為黑盒子。
“用戶在哪里,哪里就是數據和隱私的責任方。”一位軟件開發負責人稱。
比如,蘋果首屆的用戶可能更擔心自己的數據被GPT-4讀取,而一些國民級應用APP,比如微信、支付寶、抖音的用戶,則更擔心自己的數據被硬件廠商無限讀取。
蘋果當初發布Apple Intelligence(蘋果智能)時,一度因為被媒體誤認為,蘋果提到的“powered by GPT-4”,是將其核心數據“出賣”給了OpenAI,引發了其股價波動,隨后蘋果官方緊急辟謠。
在端側大模型的訓練中,用戶在APP應用中的數據可能成為新的喂料,用戶個人信息即便在APP內刪除,也會轉化為一種“知識”、“規律”被嵌入在端側模型和應用系統之中,個人隱私和行為習慣數據有可能永遠無法刪除。
05
在行業秩序層面,未經開發者,硬件廠家濫用“無障礙權限”采取模擬讀屏和點擊等方式獲取APP功能是否合法?硬件廠家和APP軟件行業將共創哪些新的行業合作規則?
在用戶隱私層面,端側大模型是否會加大用戶隱私問題?大模型對用戶交互類數據的智能化挖掘是否還會產生新的隱私和安全問題?
AI硬件時代大勢已至,但一系列新的問題值得思索,新的秩序急需建立。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.