每經(jīng)記者:石普寧 每經(jīng)編輯:唐元
在成都高新區(qū)的產(chǎn)業(yè)園,想約企業(yè)老總采訪也許并不是件難事,但想要預(yù)約機(jī)器人,可得提前敲定“檔期”,因為它們的“行程”已經(jīng)被研發(fā)攻堅和場景驗證分割成需要精確排布的寶貴資源。
不久前,成都市首批智能機(jī)器人實景驗證活動正式啟動。由成都阿加犀智能科技有限公司(以下簡稱“阿加犀”)提供核心AI技術(shù)支持的具身智能機(jī)器人“通天曉”站上了成都東御街繁忙的路口,化身交通勸導(dǎo)員,協(xié)助交警維護(hù)交通秩序。
在混雜的車流、好奇的人群以及變幻的信號中,它每一次抬手和轉(zhuǎn)向,展現(xiàn)的都不僅僅是機(jī)械運動,而是一次基于本地實時感知的復(fù)雜決策。用阿加犀機(jī)器人技術(shù)總監(jiān)侯昱帆的話來說,“這是一個直面突發(fā)情況的‘考場’。”
這場在街頭上演的“大考”,將一個深刻的技術(shù)問題拋至臺前:當(dāng)AI試圖真正走進(jìn)物理世界,以一個強(qiáng)大的“身體”站在這里,但它的“靈魂”——也就是它的大腦,如果僅僅依靠一根看不見的網(wǎng)絡(luò)“臍帶”連接至云端,這套體系還可靠嗎?
對于阿加犀和它所代表的“端側(cè)AI”技術(shù)路徑而言,答案早已明確:“靈魂”和“身體”,皆在場。本期《創(chuàng)史記》,《每日經(jīng)濟(jì)新聞》記者和阿加犀COO史碩、機(jī)器人技術(shù)總監(jiān)侯昱帆,聊了聊他們的創(chuàng)業(yè)故事。
從察覺風(fēng)口,到踏風(fēng)而行
一家公司的技術(shù)路徑選擇,往往源于其初創(chuàng)的基因。
對于成立于2020年的阿加犀而言,他們的故事并非始于機(jī)器人,而是始于更早之前的一場移動端技術(shù)革命。
隨著集成NPU(神經(jīng)網(wǎng)絡(luò)處理單元)的AI芯片成為智能手機(jī)等移動設(shè)備的標(biāo)配,AI算力實現(xiàn)了指數(shù)級躍升,一個全新的、潛力巨大的計算平臺已然成型,但其潛能遠(yuǎn)未被開發(fā)。
“早在2018年,我們就發(fā)現(xiàn),智能手機(jī)等移動設(shè)備的細(xì)分算力已經(jīng)非常強(qiáng)了,但實際應(yīng)用卻被局限在拍照(AI增強(qiáng))等少數(shù)場景中,”史碩回溯道,團(tuán)隊敏銳地發(fā)現(xiàn),邊緣側(cè)芯片中強(qiáng)大的AI計算單元大部分時間處于“休眠”狀態(tài),其潛力“遠(yuǎn)遠(yuǎn)沒有被發(fā)揮出來”。
正是這未被完全喚醒的邊緣算力,為想象開啟了廣闊空間。這意味著,智能手機(jī)可以在沒有網(wǎng)絡(luò)的情況下,完成實時語音翻譯等功能;安防攝像頭可以在本地完成對異常入侵的識別;海量的工業(yè)與物聯(lián)網(wǎng)傳感器,也因此擁有了“就地思考”的能力,而無需將所有原始數(shù)據(jù)打包上傳。
這一愿景,直接催生了阿加犀核心產(chǎn)品的誕生——以AidLux為代表的一系列AI開發(fā)工具。其覆蓋模型訓(xùn)練、模型優(yōu)化、轉(zhuǎn)換及部署等核心環(huán)節(jié),能夠?qū)⒋竽P涂焖俎D(zhuǎn)化為更輕量化的形態(tài),適配各類邊緣側(cè)芯片,實現(xiàn)高效推理。
位于成都高新區(qū)的阿加犀辦公場所 圖片來源:受訪者供圖
2022年底大模型的集中“爆發(fā)”,對阿加犀而言,與其說是印證了當(dāng)初的戰(zhàn)略抉擇,不如說是為早已鋪設(shè)好的技術(shù)軌道指明了“目的地”。
市場對“AI靈魂”的價值達(dá)成了空前共識,而這為團(tuán)隊深耕的端側(cè)技術(shù)創(chuàng)造了巨大的需求。同樣,機(jī)器人這個融合了感知、計算、決策和執(zhí)行的復(fù)雜載體,恰恰是端側(cè)AI價值最為極致的體現(xiàn)。
隨著端側(cè)AI爆發(fā)元年的到來,阿加犀此前的積累演變?yōu)橄劝l(fā)優(yōu)勢。團(tuán)隊果斷將技術(shù)沉淀聚焦到具身智能這個“試煉場”——通過與機(jī)器人產(chǎn)業(yè)鏈上下游廠商的合作,為機(jī)器人提供一體化解決方案。
“我們提供高性能的定制化機(jī)器人主控板作為算力基座,深度集成Linux、ROS等多種操作系統(tǒng)以及強(qiáng)大的AI能力,為客戶提供從底層算力到上層智能決策的全棧技術(shù)支持。”史碩總結(jié)道,正是基于此,讓他們在“具身智能”這個飛速崛起的黃金賽道中,找到了屬于自己的生態(tài)坐標(biāo)。
用端側(cè)AI,回應(yīng)大模型痛點
云端AI的強(qiáng)大毋庸置疑,但它與物理世界之間,始終存在著一條看不見的“臍帶”。這條連接著遠(yuǎn)方數(shù)據(jù)中心的“臍帶”,在賦予AI強(qiáng)大能力的同時,也帶來了成本、延遲和隱私這三大根本性制約。
從成本來看,全球科技巨頭們正為此付出驚人的代價。
根據(jù)公開資料,微軟與OpenAI一個計劃于2028年啟動的數(shù)據(jù)中心項目,成本預(yù)計高達(dá)1000億美元。
谷歌、微軟和Meta三巨頭明年的資本支出預(yù)計將達(dá)到1600億美元,大部分用于購買英偉達(dá)昂貴的GPU。這種“燒錢”模式引發(fā)了關(guān)于其商業(yè)回報可持續(xù)性的質(zhì)疑。
再看延遲——不同場景中,一秒之內(nèi)的誤差很可能招致不可設(shè)想的后果。例如,當(dāng)AI需要駕駛汽車或與人協(xié)作時,網(wǎng)絡(luò)延遲就成了不可忽視的操作性問題。“像我們在自動駕駛時,不可能把圖像上傳到云端用于計算再返回,這可能已經(jīng)過去一兩秒了,沒法做及時的判斷。”史碩舉例談道。
除此之外,還有難以用金錢衡量的隱私問題。
家庭機(jī)器人會記錄下日常生活的私密片段,工業(yè)機(jī)器人則掌握著生產(chǎn)線的核心數(shù)據(jù)。“我們都不希望涉及隱私的數(shù)據(jù)被泄露,”史碩強(qiáng)調(diào),像某些高度敏感的數(shù)據(jù),天然便不適宜儲存于第三方服務(wù)器中。
正是在上述背景下,端側(cè)AI逐漸從一個技術(shù)的時髦詞演變?yōu)橐还尚袠I(yè)趨勢。其核心思想很簡單:剪斷那條連接云端的“臍帶”,讓算法和模型直接在智能手機(jī)、PC、汽車和機(jī)器人這些離用戶更近的終端設(shè)備上運行。
在CES 2025上,阿加犀聯(lián)合高通發(fā)布了其在人形機(jī)器人領(lǐng)域的首款原型機(jī)——通天曉(Ultra Magnus),其在展會上展現(xiàn)出色的智能交互能力。圖片來源:受訪者供圖
史碩對此解釋道:“我們希望未來每一個終端都有一個智慧大腦,而這個大腦一定在端側(cè)。阿加犀為客戶提供解決方案,而最終的應(yīng)用落地還是要根據(jù)客戶以及合作伙伴的需求來決定。”
挑戰(zhàn)同樣嚴(yán)峻:當(dāng)前,端側(cè)設(shè)備在計算能力、功耗控制與內(nèi)存帶寬方面,仍難以支撐大規(guī)模模型運行。
基于此,阿加犀便展現(xiàn)出它的“行業(yè)價值”——其并非否定云端的作用,而是通過一套精巧的技術(shù)方案,將云端訓(xùn)練好的大模型能力,適配到兼具成本優(yōu)勢、低延遲響應(yīng)和隱私保護(hù)特性的端側(cè)設(shè)備上。
史碩將這個過程描述為:“把參數(shù)非常龐大的模型,通過量化剪枝等方式,加速集成在邊緣側(cè)芯片上,使其實現(xiàn)高效推理運行,這需要解決很多技術(shù)上的挑戰(zhàn)。”
躊躇滿志,并腳踏實地
一個專注底層技術(shù)、面向全球市場的公司,扎根成都的“基因”是什么?這個問題的答案,指向了一種深層次的企業(yè)與城市的“共生關(guān)系”。
人才,是所有科技創(chuàng)新的第一要素。
成都不乏高等院校,但阿加犀更看重的,是這里獨特的人才生態(tài)。“我們的優(yōu)勢首先體現(xiàn)在人才上,其實成都很多的優(yōu)秀人才是‘回流’的,他們可能在外積累(行業(yè)經(jīng)驗)之后,又回到了成都安居樂業(yè),”史碩觀察到。而這批擁有大廠經(jīng)驗和開闊視野的人才,為成都的科創(chuàng)企業(yè)注入了源源不斷的新鮮血液。
而當(dāng)類似阿加犀的企業(yè)在本地扎根并壯大后,一個良性的“引力場”效應(yīng)開始顯現(xiàn):本土成長起來的科技領(lǐng)軍企業(yè),開始主動地影響和塑造著區(qū)域的產(chǎn)業(yè)生態(tài),將更多的全球資源和行業(yè)目光吸引至此。
史碩舉了一個例子,“近兩年來,高通面向全國舉辦的AI開發(fā)者大賽(高通邊緣智能創(chuàng)新應(yīng)用大賽)就落地到了成都,這其實也是在阿加犀和高通長期合作的基礎(chǔ)上實現(xiàn)的。另外,我們現(xiàn)在有很多的合作伙伴,他們在成都的分公司也都與我們都產(chǎn)生了更緊密的合作。”
紅燈時,交警引導(dǎo)車輛通行,“通天曉”勸導(dǎo)攔停行人 圖片來源:阿加犀智能科技
除了人才和產(chǎn)業(yè)鏈,成都提供的另一種獨特“養(yǎng)分”,是愿意將自身作為“試驗場”的開放姿態(tài)。對于AI企業(yè),尤其是需要與物理世界交互的具身智能企業(yè)而言,數(shù)據(jù)和場景是其技術(shù)和產(chǎn)品迭代的“燃料”。
此次具身智能機(jī)器人的實景驗證,便是一個例證。侯昱帆舉例說:“我們通過視覺攝像頭采集交通數(shù)據(jù),可以用于后續(xù)模型訓(xùn)練,讓機(jī)器人能夠更穩(wěn)定地去適應(yīng)復(fù)雜的車流環(huán)境。”
采訪行將結(jié)束時,一個細(xì)節(jié)描繪出這家公司的內(nèi)部肌理:在辦公室的一端,我們與史碩道別;而在長廊的另一頭,侯昱帆已經(jīng)站在公司創(chuàng)始人敞開的辦公室門口,快速直接地溝通著技術(shù)問題。
這恰好印證了史碩最后用來形容公司的兩個詞:一個是“躊躇滿志”:他們看到了端側(cè)AI與具身智能結(jié)合的巨大歷史機(jī)遇;另一個是“腳踏實地”:“每一個產(chǎn)業(yè),它的方案和最終技術(shù)落地都是真正做出來的”,需要一步一個腳印地去積累、去驗證。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.