出品 | 網(wǎng)易科技《態(tài)度AGI》
作者 | 袁寧
編輯 | 丁廣勝
618期間,一款剛推出不到兩周的兒童AI硬件登頂了京東嬰幼童玩具618累計競速榜首。同樣在榜的,是頻繁刷屏的 Haivivi ,以及朱嘯虎投的Fuzozo。
這款賣爆了的產(chǎn)品叫“小方機”,是顧嘉唯最新的AI硬件終端,剛剛在六一兒童節(jié)期間推出。產(chǎn)品開售前一天,我和他的一位同事聊天,她告訴我,今天太忙了,首發(fā)全售罄,忙著備貨,每天被罵。
這并不是顧嘉唯的第一個爆品。在圈內(nèi),他職業(yè)生涯最早的標(biāo)簽是 “技術(shù)天才”。
微軟研究院、百度人工智能研究院,28歲入選百度“少帥計劃”,深度參與 Windows8、Xbox Kinect 、百度無人車、圖像搜索等重大創(chuàng)新項目,主導(dǎo)過BaiduEye 智能眼鏡、DuBike 智能單車、DuLight、FaceU 臉優(yōu)等前沿產(chǎn)品研發(fā)。
2016年,他離開百度,帶著一款“會讀繪本的貓頭鷹”閱讀機器人 Luka 盧卡,用深度學(xué)習(xí)打造的無屏觸控技術(shù),在桌面上構(gòu)建起孩子與圖書知識之間的互動。
在“大模型”這個詞還沒有火的時候,打開了 AI 走入兒童家庭教育的可能性。目前,Luka 盧卡已賣出近千萬臺,遍布18個國家。
2023年,顧嘉唯重新創(chuàng)業(yè),創(chuàng)辦靈宇宙,并快速完成三輪融資。
“小方機”,依舊面向孩子,也依舊不靠屏幕。用顧嘉唯的話來說——這是一款 AI Native, Voice First 的智能終端。
他認(rèn)為,這一輪 AI 涌現(xiàn)出主動意識、擬人感和長短期記憶的智能體之后,就不再需要人去適應(yīng)技術(shù),不再以設(shè)備為中心,轉(zhuǎn)而以世界為中心。隨即將 AI 從“屏幕后的服務(wù)”,變成了“現(xiàn)實世界的共生體”。一句話概括:AGI 正在從數(shù)字世界通往物理世界。
如果說,過去他所打造的Luka盧卡是陪眾多家庭的孩子“讀萬卷書”,那Ling靈宇宙的”小方機“則是帶更多孩子“行萬里路”。
左邊為 Luka 盧卡,右邊為 Ling 靈宇宙 AI 小方機
從產(chǎn)品形態(tài)上看,“小方機”尺寸不大,掛在脖子上,擁有達(dá)爾文、愛因斯坦、馬斯克、蘇東坡、曹文教授、獅子老爸等眾多角色,成為孩子身邊的“超級學(xué)伴”。
核心亮點是其facetime功能:AI學(xué)伴可以實時接收視頻流,像打視頻電話一樣”看見“現(xiàn)實世界,隨時回答孩子們“這是什么”、“為什么是這樣”。
但并非爽文。從微軟、百度到靈宇宙,這并不是顧嘉唯故事的全部。
微軟研究院時期,顧嘉唯的研究領(lǐng)域叫做 Tangbile & Embodied Interaction “可觸摸實體和具身交互”,為的是打通虛實世界做可觸摸有實體的人機交互,包括 Haptics 觸覺、手勢體感等。
但那時他所做的大多技術(shù)原型都比時代早了好幾步,也因此在當(dāng)時多半沒能走入主流市場。
二次創(chuàng)業(yè)創(chuàng)辦靈宇宙前,他又經(jīng)歷了背后上市公司出事,背上幾億連帶債務(wù),房子抵押,MBO管理層回購自救。那時候他們的辦公室現(xiàn)在是泡泡瑪特總部,當(dāng)時光辦公室裝修就花了2000萬。
但在他眼中,這些都是寶貴的“認(rèn)知財富”。
他挺過來了,也變了。
而從“讀萬卷書”的Luka盧卡到“行萬里路”的小方機,看似產(chǎn)品延續(xù)路徑背后,也實則是一套思維模型的逐步落地。
顧嘉唯認(rèn)為,硬件不是目的,技術(shù)也不是賣點,人工智能真正稀缺的是交互方式和數(shù)據(jù)閉環(huán),是“世界模型的入口”。
他并不想造一個“更好用的早教機或是學(xué)習(xí)機”,而是要成為“孩子們的第一個AI伙伴”,打造“面向下一代的AI終端”,“一個類似電影《Her》中展示的產(chǎn)品”。而這條路,他從十多年前在百度嘗試 BaiduEye 這個項目就已經(jīng)開始。
因此,與其說他在做兒童產(chǎn)品,不如說他在以孩子為起點,去試圖定義下一代的交互范式。
他說,產(chǎn)品不是終點,終端才是。Luka 盧卡、小方機,對他來說,都是這個終端生態(tài)的一部分,是他構(gòu)建“物理世界 AI-OS 智能操作系統(tǒng)”的起點。
他提供了一個簡單的比喻:想象一下,如果每個人都擁有一臺能說會道的超級 AI 智能終端——一臺比每個人類知道得更多、計算得更快、無所不知、無所不能、無所不在的新型 AI 計算機,在身邊作為“第二大腦”,我們的生活和工作會是什么樣子?
顧嘉唯清楚地知道:他要的不只是一個爆款產(chǎn)品,而是一個能承載未來的智能人機交互底座。
和顧嘉唯見面時,已經(jīng)是晚上8點。談話開始前,他剛結(jié)束和一個客戶的視頻會議,手里還拿著一臺用來演示的小方機。
顧嘉唯正在演示靈宇宙 AI 小方機
他說,“你真上手體驗后,就會顯而易見地發(fā)現(xiàn) ta 和別的不一樣。”
談話后半段,臨近9點,他才吃上晚飯,一邊吃,一邊講著他的邏輯。
他投入,或許不是因為對風(fēng)口的迫切,而是他知道,這次,他離想要的答案,還差一點。他必須再試一次。
以下為網(wǎng)易科技《態(tài)度AGI》欄目與顧嘉唯的交流,經(jīng)不改變原意的編輯。
01我經(jīng)歷過房子抵押、MBO自救的階段
網(wǎng)易科技:我看你們以前叫“物靈科技”,現(xiàn)在叫“靈宇宙”,是改名了嗎?
顧嘉唯:不是改名,是進(jìn)入重新創(chuàng)業(yè)的新階段。十年前我們最初的理念是“萬物有靈,人機共生”,你們看到柜上的那行書法字,還是當(dāng)年一位我很尊敬的長者寫的。
這塊牌子曾經(jīng)就掛在我們在浦項中心頂樓的辦公室里,那里曾有望京最高的“萬物有靈”咖啡廳在我們的“共生廣場”,如今那個地兒變成了泡泡瑪特的全球總部。
過去幾年波折,我們也換過好幾個地兒,今天你看到它在這兒靜靜地杵著,就像一個信物,默默見證了我們涅槃重生的全過程。
我們從做Luka 盧卡開始,一路走來,已經(jīng)實現(xiàn)了千萬臺設(shè)備,進(jìn)入了大約400多萬個家庭。
你也看到辦公室放著各式各樣的家庭機器人的探索,我們是家庭陪伴機器人真正從早期就定義品類的玩家。
在 Luka 盧卡出來之前,都是語音交互的屏幕和娃娃身子的產(chǎn)品。現(xiàn)在市面上的產(chǎn)品,帶攝像頭掃描桌面可以搜題可以查詞的各類學(xué)習(xí)機早教機,其實都在跟進(jìn)我們的思路,是我們所定義產(chǎn)品,被拆解、復(fù)制的組合體。
我一直強調(diào),我們做的是定義下一代 AI 終端的工作,從不做追隨者。無論是在微軟還是百度,我一直在做的是面向未來五到十五年的事。創(chuàng)業(yè)后,我任務(wù)就是帶著“望遠(yuǎn)鏡”的遠(yuǎn)景和“顯微鏡”的執(zhí)行。
網(wǎng)易科技:“小方機”這個產(chǎn)品是從什么時候開始做的?
顧嘉唯:從“Luka 盧卡”之后我們就開始做了,其實已經(jīng)做了好幾年。這期間背后上市公司出現(xiàn)問題,也對我們有比較大的影響。
但今天的產(chǎn)品定義,跟當(dāng)年早期版本比還是有挺大的變化,畢竟今天 AI native 智能原生的底層大模型時代是最大的新契機。
當(dāng)年 Luka 盧卡得益于 AI 計算機視覺的技術(shù)紅利,從一眾語音對話機器人之列脫穎而出,今天各式各樣的陪伴機器人都是讓手辦潮玩、毛絨玩具開口說話,其實馬上這個市場就會經(jīng)歷一個惡性競爭階段和殘酷的洗牌過程。
而我認(rèn)為,所有模態(tài)都會達(dá)到類似的“低垂果實”程度,之后就進(jìn)步緩慢,逐步拉齊,目前視頻追上了文字,后續(xù)具身智能機器人也會追上。
所以我的思路是,在技術(shù)逐步收斂期,要做長在技術(shù)延長線上的容器屬性的智能終端,而不是一個一個容易被技術(shù)迭代淹沒的產(chǎn)品。
網(wǎng)易科技:背后上市公司出現(xiàn)問題,當(dāng)時是什么情況?
顧嘉唯:說白了就是我們背后的上市公司資金杠桿出問題了,老板進(jìn)去了,我自己都有幾個億的無限連帶。
那段時間我把房子抵押出去,團隊能一起扛過來,是最大的福分,用朋友的錢一起做 MBO,就是為了救出公司。還好當(dāng)時還有“Luka 盧卡”這個產(chǎn)品在撐,保證了公司基本盤運轉(zhuǎn)。
那幾年我算是“消失”了,其實都在救公司、做重組。如果當(dāng)時公司沒出事,我可能早就把上面說的事做起來了。
但也不是壞事。今天到了更好的 timing。況且,年輕時候踩坑,總比晚踩強。
網(wǎng)易科技:當(dāng)時16年你從百度出來創(chuàng)業(yè)沒有從一級市場拿錢嗎?
顧嘉唯:對,第一次創(chuàng)業(yè)沒拿一級市場的錢,我們是直接跟上市公司一起起盤的。
為了創(chuàng)辦物靈科技這家機器人 OS 公司, 2016年那時候我們從二級市場定增中拿出3個多億投美國機器人本體公司,為了做機器人操作系統(tǒng)。
LingOS驅(qū)動的產(chǎn)品
因為當(dāng)時國內(nèi)沒有好的機器人本體,我跑去大洋彼岸看遍了當(dāng)年北美高校各家 DARPA 資助的人形機器人16家研究機構(gòu),最后投了包括現(xiàn)代機器人之父 Rodney Brooks 的公司 Rethink Robotics 在內(nèi)的三家機器人本體, 4個多億投入做人工智能深度學(xué)習(xí)和機器人相關(guān)的研發(fā)投入。
我們那時候的辦公室現(xiàn)在是泡泡瑪特總部,當(dāng)時光辦公室裝修就花了2000萬。
但這也是為什么我現(xiàn)在做事謹(jǐn)慎務(wù)實,因為我經(jīng)歷過資本膨脹的年代,也經(jīng)歷過暴雷、兜底、重啟的一整個周期。
網(wǎng)易科技:為什么重新創(chuàng)業(yè)會選擇做“小方機”?是因為有大模型的出現(xiàn)嗎?
顧嘉唯:首先我一直在堅持這個方向,大模型的成熟只是讓這件事變得有更高的天花板了。
其次我們的產(chǎn)品不僅是做給小孩或者年輕人的,我們原來也做過針對各種人群的家庭陪伴機器人。初心從我創(chuàng)辦物靈科技開始就沒變過, 只是選擇了一條“南坡”路徑,跟大多數(shù)直接干人形機器人的公司,長得很不一樣。
這次我們做“小方機”,核心是為了打造一個家庭機器人所必須的家庭場景和人機活動場景的數(shù)據(jù)閉環(huán),通過第一視角的智能體,把用戶在真實場景下操作動作的過程記錄下來。
因為當(dāng)前我們真正缺的,不只是末梢抓取和運控的通用泛化能力,更重要的是人類在現(xiàn)實情境中如何行動,空間、物體、動作、行為的數(shù)據(jù)。
特別是類似大語言文本模型中“predict next token”,接下去在真實世界中如何推理“下一步”行為任務(wù)的通用能力的數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠。
02 “Luka盧卡”“小方機”都只是這階段落地的最佳形態(tài),目標(biāo)一直是數(shù)據(jù)
網(wǎng)易科技:收集數(shù)據(jù)?這是一個怎樣的邏輯?
顧嘉唯:這個邏輯其實就像特斯拉造車一樣,造電動車只是中間過程,打造 FSD 終極目標(biāo)是自動駕駛。
而小孩就是唯一真正會在物理世界中自由探索的個體,他們不只會和各種人發(fā)生互動,智能體可以引導(dǎo)孩子同世界持續(xù)交互。
有篇論文嘗試讓小孩頭上戴一個GoPro頭盔去記錄3到8歲的所有行為過程,讓這些數(shù)據(jù)涌現(xiàn)智能,出現(xiàn)了出奇的效果。
但這樣的實驗環(huán)境很難搭建,現(xiàn)實中你不可能讓孩子一直戴著GoPro。所以我們需要一個真正能讓孩子愿意使用的產(chǎn)品。
我一直在做的就是這件事。十年前在百度的時候就已經(jīng)在做相關(guān)工作了。這只是一個用來收集數(shù)據(jù)的價值終端,我們一直沒有偏離這個方向。
網(wǎng)易科技:那為什么不做AI眼鏡呢?如果要采集數(shù)據(jù)的話,眼鏡不是一個很好的終端嗎?
從微軟研究院到百度研究院,智能眼鏡我也做過挺多代,無論是帶光機顯示的 AR 眼鏡 HoloLens,還是只有攝像頭的 AI 眼睛 BaiduEye,而在大模型時代它其實作為主要載體,數(shù)據(jù)的價值剛剛開始,也是為了采集人在物理世界里是怎么操作事物完成空間的過程。
“具身智能大腦”真正缺的是這種數(shù)據(jù),不是別的。你靠互聯(lián)網(wǎng)視教遠(yuǎn)程操控或者仿真模擬,是無法獲取到真實有效的數(shù)據(jù)的。
關(guān)于家庭機器人的技術(shù)發(fā)展,我們其實是在沿著兩條主線持續(xù)推進(jìn):
第一條主線,“第一視角人生數(shù)據(jù)閉環(huán)”的采集路徑。這條路徑我從過去做到現(xiàn)在從未變過。
以前Luka盧卡收集的是桌面上的交互數(shù)據(jù),現(xiàn)在我們收的是整個真實世界(物理場景)中,孩子和環(huán)境空間交互的數(shù)據(jù)——孩子每天怎么跟世界交互、在什么情境下產(chǎn)生了什么行為,我們都能收集。
你可以理解為我們在構(gòu)建一種全場景、全交互的“世界輸入層”。未來世界的交互入口,不再是APP,而是你和世界本身的連接方式,我們就是在定義這個連接。
第二條主線,“第三視角數(shù)據(jù)”的采集路徑。比如現(xiàn)在的 Luka盧卡,它不僅能跟用戶進(jìn)行 桌面級的互動,還可以加裝手腳、輪足、機械臂,實現(xiàn)寫字、畫畫、抓取道具等能力。用戶可以與之進(jìn)行更深度的物理互動。
小方機也在做這件事,它是以AI角色的方式陪伴孩子,用具備“主動意識”和“長短期記憶”的“擬人化”角色,作為觀察者,在一天的日常生活 lifelogging持續(xù)采集孩子的行為軌跡和成長過程。
首先,下一個 AI 終端一定是新的交互形式。
因為人機交互的發(fā)展路徑已經(jīng)很清晰——從客廳里的大屏幕,到桌面屏幕,再到口袋里的手機屏幕,最終一定走向“invisible 無形”。
當(dāng)屏幕消失之后,下一代計算終端只有兩條路:一是比特交互為主的極致隨身化、小型化個人計算設(shè)備;二是原子交互為主的具身智能,能操縱真實世界的機器人。
所以你要么走可穿戴終端的方向,把 AI 能力越來越貼近人;要么直接走到“機器人”的路徑,讓機器替人去物理世界。這兩個方向,也是我始終圍繞在做的核心。
網(wǎng)易科技:為什么要沿著這兩條路徑走?底層邏輯是什么?
顧嘉唯:其實這兩條路徑的目的,都是為了解決當(dāng)下最大的問題:物理世界里的空間交互數(shù)據(jù)非常稀缺。
現(xiàn)在,文本、圖像類數(shù)據(jù),其實已經(jīng)相對完善了,但物理世界里的行為數(shù)據(jù)還沒有被系統(tǒng)性地采集,這正是通向 Physical AI 具身智能大腦最大的不確定性所在。
人類也好,人形機器人也罷,要實現(xiàn)通用泛化的動作、習(xí)慣、任務(wù)的調(diào)度與預(yù)判,全靠這些空間交互行為數(shù)據(jù)。
沒數(shù)據(jù)就沒智能。所以我們這兩個路徑,本質(zhì)上都是在為AI構(gòu)建下一代的行為世界模型——你怎么行動、接下來會怎么行動,這些都是靠真實設(shè)備在最有價值的場景中收上來的。
這兩種維度的數(shù)據(jù),一個是觀察人怎么操作物理世界,一個是作為“人”的延伸去感知世界。它們是建立世界模型最需要的數(shù)據(jù),最重要的是,這里需要的數(shù)據(jù)量級。現(xiàn)在沒有哪家公司能像我們這樣,通過大規(guī)模實打?qū)嶄佋O(shè)備、收數(shù)據(jù)的方式,走出閉環(huán)路徑。
我認(rèn)為,當(dāng)下我們的思路是在構(gòu)建具身大腦路徑中拿入場券、拿門票。因為具身項目目前都需要一步步的迭代且落地周期都相當(dāng)長,短期要找場景能閉環(huán)商業(yè)化的“家庭陪伴”是一條路徑,有機會從產(chǎn)品失效成本低的簡單場景搜集數(shù)據(jù),逐步迭代到復(fù)雜場景。
當(dāng)時我們物靈科技做各類服務(wù)機器人,有商業(yè)用途的也有家用的,除了桌面機器人,還有能在屋子里跑,也能在室外活動,是為了補全視角與交互的類型——但那時候技術(shù)條件還不到。現(xiàn)在不同了,時代到了。
外界總以為我在做的是“Luka盧卡”那類C端產(chǎn)品,實際上,C端只是落地的形態(tài),背后的目標(biāo)一直是數(shù)據(jù),構(gòu)建世界模型的終極數(shù)據(jù)閉環(huán)。
網(wǎng)易科技:你剛提到,要做定義下一代的產(chǎn)品,“小方機”如何定義下一代?從 Luka盧卡到小方機,這其中的思路是什么?
顧嘉唯:其實從桌面交互延伸出來的路徑,我們做了很多年,也經(jīng)歷了不少波折。
現(xiàn)在我們重新定義好 AI 終端,服務(wù)好這個我們熟悉的人群和產(chǎn)品形態(tài),我們的優(yōu)勢在于交互和軟件操作系統(tǒng),我們其實并不是一個設(shè)備公司,軟件交互定義硬件設(shè)備,這是我們在這個 AI 時代的定義。因為我一直相信我在做的業(yè)務(wù),硬件只是手段,軟件才是目的。通過硬件守住用戶場景,軟件積累價值數(shù)據(jù)。
硬件形態(tài)上,你看過電影《Her》嗎?我們的理念就是那個形態(tài),核心不是耳機,而是一個具備實時互動能力的智能體。
下一代的手機形態(tài),可以手持,也可以在胸前攝像頭看得見眼前的實時場景,這是2013年電影設(shè)定的2025年人類跟 AI 操作系統(tǒng) OS1如何共生的劇情。
就像你剛才看到的 demo,我在物理世界中向你展示的那些互動場景,那就是我們所定義的隨身角色,一個在你身邊、實時與你交互的智能助手。
網(wǎng)易科技:所以這也是我們掛脖設(shè)計的出發(fā)點嗎?第一視角的交互方式,就像《Her》里的體驗一樣。
顧嘉唯:對,這就是我常說的,AI 發(fā)展的路徑里,只有在目前從智能體 Agentic AI 往物理世界 Physical AI進(jìn)化的結(jié)構(gòu)性節(jié)點上,才有可能誕生“原生設(shè)備( AI native device)”的新機會。
以前我們只是把AI疊加在手機、電腦等已有設(shè)備上,做一些效率提升的事情。但只有當(dāng)AI成為一個獨立的交互介質(zhì),才能誕生新的品類。
現(xiàn)在去正面跟手機、眼鏡競爭其實很難短期成就獨立計算終端,比如電池續(xù)航、場景限制等問題。而我想要做的就是下一代 AI 獨立計算終端,可以插 SIM 卡,可以獨立運行,那我就要找對細(xì)分市場,垂直人群的應(yīng)用場景。
我的觀點是,手機為中心的個人計算范式還會有一長段時間,眼鏡耳機這些品類本質(zhì)上屬于手機應(yīng)該去做的配件,一旦你證明有PMF(Product-Market Fit,產(chǎn)品市場匹配),大廠自然會快速跟進(jìn)。
但正因為如此,這塊領(lǐng)域不是一個對創(chuàng)業(yè)公司友好的地帶,門檻高、窗口期短,很難有持續(xù)優(yōu)勢。所以這條路我們沒有選擇。
更大的背景是,這一輪的大模型智能體就是“人”,傳統(tǒng)由人來做的事,被“人”替代了——也就是由Agent來替代真人服務(wù)。
這使得重運營成本的服務(wù)轉(zhuǎn)變成產(chǎn)品解決方案,毛利結(jié)構(gòu)也迅速變化。
以前的服務(wù)構(gòu)建需要大量人力,成本高,毛利低。而Agent的加入,讓成本下降,毛利提升,同時商業(yè)模式也發(fā)生了進(jìn)化。現(xiàn)在越來越多的人是買產(chǎn)品來獲得服務(wù),而不是單獨為服務(wù)付費,最典型的例子還有疫情雙減后的教培行業(yè)跟學(xué)習(xí)機的關(guān)系。
03 “交互方式的變革”只能從新一代開始,小方機是孩子的第一個AI朋友
網(wǎng)易科技:這就涉及一個“賣給誰”的問題。“小方機”的用戶人群是怎么樣的?
顧嘉唯:是的。我們這代人小時候是穿鞋套進(jìn)機房的,我們當(dāng)時用的 IT 產(chǎn)品,是微軟這些老品牌服務(wù)我們的產(chǎn)物。
可今天主流的應(yīng)用,已經(jīng)不是我們用的那些東西了。你看看00后,甚至10后、20后在用的產(chǎn)品,你可能一個都沒聽過。
而現(xiàn)在,我們的用戶人群結(jié)構(gòu)已經(jīng)變了,事實上每一代信息產(chǎn)品到智能產(chǎn)品,回顧 snapchat、insgram、tikok 等,都是從更年輕的人群開始滲透,且年齡越來越低。
因為“交互方式的變革”只能從新一代開始。 新的交互方式,比如像Her(電影《她》)里的那種與AI情感交互,必須從智能時代的原住民那里開始。所以我們選擇兒童,是因為他們才是真正會使用、習(xí)慣并期待新交互方式的一代。
人口學(xué)中把00-10后稱為“阿爾法世代”(“Generation Alpha”)。
所謂“阿爾法世代”用戶,指的就是智能時代的原住民,我們的產(chǎn)品就是為這撥人設(shè)計的。另外像95后這代年輕家長,他們作為客戶,天然接受新形態(tài)產(chǎn)品, 期待孩子有個哆啦 A 夢陪伴成長。
我們會持續(xù)深耕這一人群,先從0-15歲兒童到青少年階段入手,這部分我們已經(jīng)建立了一個足夠大的用戶基本盤——接近千萬的設(shè)備,積累了大量的用戶數(shù)據(jù)。
此外,我們發(fā)現(xiàn),美國60歲以上的老人也在玩我們的產(chǎn)品,所以用戶的年齡結(jié)構(gòu)其實也會不斷拓展。 “交互方式的變革”只能從新一代開始,小方機是孩子的第一個AI朋友。
向上的話,我們將從兒童成長延伸到15-30歲的年輕人、寵物經(jīng)濟,以及30-50歲父母的育兒家庭帶娃場景。再往下我們會覆蓋到老年用戶的養(yǎng)老場景。
另外,從數(shù)據(jù)的角度來看,如果你沒法伴隨一個人的成長,那就不可能數(shù)據(jù)化這個人。而新一代的 AI-OS 原生的消費科技公司肯定是完全長在人類的全生命周期的數(shù)據(jù)之上的。
當(dāng)年是像LG這樣的財閥型公司,它們能做一整條產(chǎn)業(yè)鏈,從一個紙杯到一艘航母,產(chǎn)品覆蓋全年齡段全產(chǎn)業(yè)鏈。
但今天的智能時代不是這樣。今天能不能占住用戶的心智、能不能獲取跨代際人群的數(shù)據(jù),要靠你從“第一天”開始就擁有數(shù)據(jù)閉環(huán)的能力。
這是我給今天的AI時代公司下的定義:擁有數(shù)據(jù)起點,才能構(gòu)建真正的用戶價值。
網(wǎng)易科技:聊回“小方機”本身,它的市場定位是早教機這樣的產(chǎn)品嗎?
顧嘉唯:傳統(tǒng)上最大的兩個品類,一個是早教機,主要面向?qū)W齡前的小朋友,另一個是學(xué)習(xí)機,偏向6歲以上孩子的刷題和考試準(zhǔn)備。
我們現(xiàn)在的小方機,其實是一個全新物種,它的定位是“孩子的 AI 手機”——每個孩子都應(yīng)該有一個屬于自己的“ AI 手機”,只是過去沒有合適的設(shè)備來承擔(dān)這個角色。
要知道今天的孩子身邊一堆設(shè)備,桌上的學(xué)習(xí)機、故事機,口袋里的聽力機、單詞機,手腕上的電話手表,孩子太累了,今天是最好的時間可以實現(xiàn) all-in-one 集合了多種功能于一體的 iphone moment 出現(xiàn)了。
兒童手表也可以算是上一個周期的“孩子手機”,它的底層邏輯是通信,是家長“找孩子”。定位、電話、短信這些功能是剛需,后來才長出了孩子之間的社交網(wǎng)絡(luò)。
但那是通信時代的產(chǎn)物,而不是智能時代的。而在今天,智能時代的終端應(yīng)該有新的形態(tài),小方機就是為這個時代設(shè)計的。
“小方機”的產(chǎn)品介紹
網(wǎng)易科技:那小方機起的作用是“陪伴”還是“教育”呢?
顧嘉唯:問題的核心是你怎么理解教育和陪伴。抖音本質(zhì)上也是“陪伴”,孩子的安撫毯也是“陪伴”,共性是高頻場景找的很準(zhǔn)。。
我們的小方機選擇的高頻場景,是“教育”,但我們不是傳統(tǒng)意義上的 K12教育產(chǎn)品。
教育在我看來,是一個靈魂喚醒另一個靈魂的過程。我們現(xiàn)在用Agent(AI 智能體)去重構(gòu)新的學(xué)習(xí)方式。
從 Luka 盧卡幫助孩子培養(yǎng)閱讀習(xí)慣,到 Ling 靈宇宙激發(fā)探索世界的主動性,逐漸進(jìn)階到學(xué)習(xí)習(xí)慣,從 “知識灌輸” 到 “動機喚醒” 的進(jìn)化,這才是我們的目標(biāo)。我們不是用來刷題、提分的學(xué)習(xí)機,那是上一代的教育邏輯。
很多人對“教育”的理解還停留在“刷題”“應(yīng)試”,但 AI 的真正價值在于重構(gòu) “學(xué)什么” 和 “怎么學(xué)” 的底層邏輯。
因為大模型 AI 帶來了無論從供給側(cè)還是需求側(cè),最大的產(chǎn)業(yè)變革一定會發(fā)生在傳統(tǒng)教育行業(yè),所以“教育”這個詞未來一定會發(fā)生變化,我們可能會參與其中的變革,但此刻我并不愿意用“教育”來定義自己。
比如你說“Luka盧卡”是不是教育?你說它是,它又不像傳統(tǒng)意義上的學(xué)習(xí)機。它是在陪你讀書,幫你養(yǎng)成一個好的閱讀習(xí)慣。閱讀能力的培養(yǎng)那算不算教育?
我認(rèn)為小方機也是一樣,是用“陪伴”的方式落地 AI 教育,在孩子的日常生活中建立起正向的學(xué)習(xí)路徑,核心是煥活每個人的學(xué)習(xí)動機。
如果你把教育理解為“刷題”、“提分”,那小方機肯定不是;但如果你理解為“陪伴你更好地學(xué)”,那我們就是教育的一部分,而且是一種新的教育形態(tài),新的學(xué)習(xí)方式。
舉個例子,我們的小方機會看到一個風(fēng)景水土然后啟發(fā)孩子一起吟詩作詩。這不是填鴨式教學(xué),而是文化熏陶與科學(xué)啟蒙的自然發(fā)生,是 “一朵云推動另一朵云” 的喚醒過程。
我希望孩子可以在操場暮色下,用這臺小方機穿越時空,與笛卡爾、霍金一起共同探索宇宙的奧秘。
靈宇宙AI小方機產(chǎn)品的核心價值是“世界是教室,萬物是教材”,我們希望通過這次物理世界的大模型技術(shù)變革讓孩子更多地探索世界,用大模型技術(shù)讓孩子的每一次好奇心都不掉在地上。通過孩子與 AI 共生解決問題的過程,讓普通家庭的孩子都能擁有改變世界的能力。
網(wǎng)易科技:要做到這些功能,需要很強大的長文本記憶能力,這部分“小方機”大概能支持到什么程度呢?
顧嘉唯:底層大模型已具備較強長文本處理能力,我們的核心是通過「知識庫掛載」實現(xiàn)長短期記憶的有機結(jié)合。
我們一個很大的優(yōu)勢,就是歷史積累。Luka盧卡時期我們就已經(jīng)收集了大量的兒童語音、閱讀行為、對話記錄和成長軌跡數(shù)據(jù),這些都通過統(tǒng)一賬號體系無縫遷移當(dāng)用戶登錄小方機,設(shè)備會自動加載其8歲前的成長記憶。
這就是“靈魂AI”的連續(xù)性體驗——靈性不是抽象概念,而是通過 LingOS 操作系統(tǒng),在不同設(shè)備與多智能體間還原出一個連續(xù)性的人機交互體驗——我們叫“Ling!”,這也是我們定義的點物賦靈的一層實踐的價值。
網(wǎng)易科技:用Luka盧卡的那些孩子,為什么需要再有一臺“小方機”?
顧嘉唯:很簡單,“畢業(yè)”了,核心在于“成長適配性”。
孩子年齡增長后,桌面端的電子萌寵式陪伴已無法滿足探索需求,就像從繪本閱讀進(jìn)階到戶外實踐。
我們用“讀萬卷書,行萬里路”概括這種升級。
這兩個場景,Luka 盧卡解決了知識輸入場景,而 Ling 靈宇宙 AI 小方機通過語音交互與物理世界建模,承接孩子感知世界的需求。
從桌面閱讀到戶外探索,我們的雙 AI 終端戰(zhàn)略,恰好覆蓋孩子成長階段的兩大核心訴求。因此,成長階段到了,就該有一個新的品類來承接。這就是家長換產(chǎn)品的動因。
靈宇宙的產(chǎn)品發(fā)展路徑
網(wǎng)易科技:從產(chǎn)品推廣角度看,使用者是孩子,但買單的是家長,為什么家長需要一個小方機?
顧嘉唯:很簡單,焦慮。家長焦慮的是:AI 時代來了,我的孩子接下來要學(xué)什么?怎么學(xué)?我有沒有能力、沒有時間陪他一起學(xué)怎么辦?
而且很多家長已經(jīng)意識到了問題,但他沒有辦法自己解決——那就需要新工具和新方法。
他解決不了孩子隨時隨地的“十萬個為什么”,也無法每天抽出時間做知識篩選和陪伴,所以一旦你能提供一個真正好用的工具,他當(dāng)然愿意買單。邏輯其實很簡單:讓孩子自主學(xué)習(xí)、解放家長時間,最終帶來學(xué)以所得的效果,這就是我們提供的價值。
小方機給出的解決方案是:你什么都不用管,這個 AI 終端里已經(jīng)裝好了最好用的AI工具,實時的、異步的、能對話、能生成內(nèi)容、能講故事、能寫詩、能答疑,等等全都整合在里面。
你給孩子一個普通手機,他可能刷短視頻、玩游戲;但你給他小方機,里面裝的都是為學(xué)習(xí)、成長、交流而定制的 AI 工具,而且用伙伴式交互的方式給出來的,孩子用了會愛上。
它不是一個簡單的“教育工具”,而是一個成長陪伴的“智能體”,是孩子的第一個 AI 朋友。
你可以理解為,它是孩子的“Her”,但是從小伴隨孩子成長、積累數(shù)據(jù)、建立信任的版本。既安全,又能成長,又能學(xué)習(xí),還能陪伴。比Pad更聰明,比傳統(tǒng)學(xué)習(xí)機更生動,也比手機更安心,最主要的不是以屏幕為中心,而是以真實世界為中心。
顯而易見,ta 并不只是一個聊天問答機,而是一個具身認(rèn)知 embodied 物理世界的陪伴。
網(wǎng)易科技:但是會不會有人疑惑,你剛剛提到的這些功能,現(xiàn)有的大模型工具,比如說“豆包”不是也能實現(xiàn)嗎?
顧嘉唯:但你敢把豆包直接給孩子用嗎?這是問題核心。
你去問每個家長,他們會說“我當(dāng)然知道豆包能用”,但沒人敢讓孩子單獨去用豆包。因為刷著刷著就可能跳到抖音了(笑),現(xiàn)在很多家長給孩子玩大人的手機,本質(zhì)是無可奈何的“臨時托管時間”,在家別煩我,出門別煩別人,只求換半小時清凈,絕不會長期放心讓孩子用。
我們希望國內(nèi)孩子也能像北美家庭那樣,沒那么在意屏幕,主要是出門戶外的時間多,跳出一平米書桌的苦讀書。
實際上盯著書本久了一樣傷眼,看書看多了也會導(dǎo)致近視,而小方機的核心優(yōu)勢,在于構(gòu)建了 “安全邊界 + 適齡內(nèi)容 + 啟發(fā)式交互” 的閉環(huán) —— 它不只是通用大模型的兒童版,而是專為孩子設(shè)計的 AI 學(xué)伴。
除了我們精心打造的給孩子的 AI 工具箱,讓孩子贏在 AI 的起跑線上,內(nèi)容的管控和內(nèi)容的價值是最核心的,還比如我們聯(lián)合北外曹文教授和尚方舟一起共同傾力打造的沉浸式英文教學(xué)內(nèi)容體系。
核心在于:豆包不是為孩子設(shè)計的,它沒有安全邊界和適齡內(nèi)容篩選,更沒有能夠啟發(fā)式思考鏈創(chuàng)造的循循善誘。
小方機就是要解決這個“信任”問題——它是一個專為孩子定制的、內(nèi)容精良、安全可控的AI工具。
網(wǎng)易科技:在產(chǎn)品的安全性層面,小方機是怎么保證的?
顧嘉唯:我們做兒童類的產(chǎn)品已經(jīng)很多年了,在這方面有非常深的積累。
在大模型的內(nèi)容安全上,我們有三層防護(hù):
第一層,是我們自己積累的技術(shù)棧做了大量的內(nèi)容審查和過濾機制,從源頭過濾敏感信息;
第二層,是接入了主流大模型廠商本身的合規(guī)備案機制,確保底層模型安全;
第三層,我們還調(diào)用了多家互聯(lián)網(wǎng)巨頭提供的兒童防護(hù)API,實時識別風(fēng)險內(nèi)容。
這三道防線已經(jīng)能非常好地防止風(fēng)險發(fā)生。
媒體喜歡渲染“AI風(fēng)險”,這沒問題,是他們的職責(zé)。但要分清現(xiàn)實發(fā)展階段。像我在2014、2015年做AI時,那時候大家已經(jīng)在講《終結(jié)者》了,對吧?這些過度的負(fù)面想象,其實沒必要放大。
隱私和信息安全當(dāng)然重要,但不是不能解決的問題,只要方法到位,機制到位,就沒有必要被負(fù)面情緒引導(dǎo)。我們不是在做虛無縹緲的未來產(chǎn)品,我們是做落地的、有用戶、有使用場景、有實際反饋的東西。
這套體系經(jīng)歷過 Luka 盧卡千萬級用戶的驗證,如果這個產(chǎn)品真的有問題,市場早就反饋給我們不斷提升優(yōu)化過好多輪了,我們也不是剛?cè)胄械男鹿荆?jīng)得起時間和規(guī)模的檢驗。
網(wǎng)易科技:我們的產(chǎn)品會在海外賣嗎?
顧嘉唯:我們Luka盧卡一直有在海外賣,未來新一代的產(chǎn)品也會出海。
04 AI公司的價值,不能只是做個張嘴說話的玩具
網(wǎng)易科技:那進(jìn)一步延申問,今天一個AI公司的價值應(yīng)該是什么呢?
顧嘉唯:今天決定一家AI公司價值的,不是你能不能做毛絨玩具“活過來”,不是你能不能做個玩具張個嘴說話——能做這種的公司和個人開發(fā)者太多了。
真正有價值的,是那些既能打穿供應(yīng)鏈,把產(chǎn)品落地鋪出去;又有技術(shù)經(jīng)驗,能構(gòu)建高質(zhì)量數(shù)據(jù)集;還能基于這些數(shù)據(jù),訓(xùn)練出自己的世界模型的公司。這樣的公司極少數(shù),非常稀缺。
所以,這事不是說你會大模型套殼、能做個demo就行的。你要把品牌市場、營銷渠道、產(chǎn)品體驗、內(nèi)容 IP、供應(yīng)鏈、后臺架構(gòu)、前端應(yīng)用、數(shù)據(jù)回流、AI 建模等等,這一整套體系打穿,體驗做完整,才逐步建立真正的價值。
我們團隊的優(yōu)勢就是:每一個核心關(guān)鍵環(huán)節(jié)我們都能自己做,而且能做到完整可控。既要懂得 AI 技術(shù)發(fā)展的路徑和邊界,又要懂得 IP 文化內(nèi)容和教育電子,還有對孩子成長陪伴有成功經(jīng)驗,這樣的團隊稀缺得很。
網(wǎng)易科技:其實在您準(zhǔn)備創(chuàng)業(yè)那段時間,自動駕駛也很火。當(dāng)時像您同期的余凱,就去做了地平線。您當(dāng)時為什么沒有選擇做自動駕駛?
顧嘉唯:是凱哥拉我去的百度,推動Robin給了我“百度少帥”這個稱號,帶我進(jìn)入了深度學(xué)習(xí)領(lǐng)域,也給了我很大的自由度,支持我做自己想做的事情,我一直很感恩他。
但其實我理解地平線做的是整個機器人產(chǎn)業(yè)的芯片。
做自動駕駛的公司也很多,像我身邊以前的很多人現(xiàn)在都在 MOMENTA、文遠(yuǎn)知行、小馬智行、馭勢科技這些公司里。但我現(xiàn)在立志做的,是下一個“掃地機”這樣的公司。
網(wǎng)易科技:那您當(dāng)時為什么不做掃地機器人呢?
顧嘉唯:當(dāng)時我確實面臨一個現(xiàn)實問題。我們在做機器人生態(tài)的時候,我背后的出資方是一家 A 股超級白馬股的上市公司。而當(dāng)時董事長認(rèn)為掃地機器人業(yè)務(wù)是“做回去了”的。
什么意思?那時候公司在二級市場上的市盈率是260倍,但掃地機行業(yè)的市盈率只有10倍。從資本市場的視角來看,掃地機器人被視為“回去了”。
所以那時候其實是有約束的。核心原因當(dāng)年上市公司是大股東,公司的經(jīng)營掌控權(quán)是有問題的。這些都是認(rèn)知積累的寶貴財富。
但是,我說的“掃地機器人”,其實是一種類比,代表的是一種能自我造血、能賣出量、能真正商業(yè)化的產(chǎn)品路徑。
我想做的是這件事,而不是那種長線投入、看上去融資很熱鬧的科研技術(shù)項目。 因為融資只是短期熱鬧,最終你得用經(jīng)營業(yè)績兌現(xiàn)。現(xiàn)在你看整個具身智能行業(yè),很多公司也是類似的情況,看著很火,但能否走通商業(yè)化還是未知數(shù)。
網(wǎng)易科技:那我們現(xiàn)在做的這件事,大廠不會下場來做嗎?
顧嘉唯:你看看現(xiàn)在有哪些大廠在做?又有哪些做成功了?百度那強大為什么還會有小紅書和抖音呢?
比如針對孩子這塊,或者年輕人這塊,有哪個硬件產(chǎn)品他們做成過?如果有的話,當(dāng)年也不會有步步高、不會有段永平的商業(yè)傳奇故事了,早就被大廠干掉了。
網(wǎng)易科技:那像學(xué)而思這類的在線教育企業(yè)呢?
顧嘉唯:學(xué)而思是做“嚴(yán)肅教育”的定位很清楚,就是K12賽道,是“正統(tǒng)教育體系”內(nèi)的東西。
但我們做的不是K12教育提分應(yīng)試,也不是純粹意義上1平米書桌上的學(xué)習(xí)機。孩子的未來,不該交給書桌上的學(xué)習(xí)機。
我們靈宇宙創(chuàng)造的 AI 小方機,是讓孩子走出去,行萬里路,培養(yǎng)探索世界的主動性,獨立思考和堅持判斷。
我們真正要培養(yǎng)的,是孩子的好奇心和探索精神,而不是凡事都依賴 AI 的順從者。未來我們的整個教育體系會怎樣?我們將如何撫養(yǎng)我們的孩子?這些都是值得思考的問題。
我認(rèn)為我們每個人現(xiàn)在都應(yīng)該意識到,如何與 AI 共存,快速適應(yīng)嘗鮮新技術(shù),如何向 AI 學(xué)習(xí),保持自我謙虛,不恥于提問,讓它們教我們更多的知識和能力。
我覺得如果你有孩子,今天就可以開始改變他們的一些學(xué)習(xí)內(nèi)容,讓他們成為 AI 原生代。讓他們大膽使用 AI 完成任何他們想做的工作,而不僅僅是與 AI 閑聊或完成家庭作業(yè)。
應(yīng)該讓他們做我們以前從未想象過的事情,讓他們從畢業(yè)的那一刻起成為最熟悉 AI 的人,而不會因為讀書的時候只學(xué)習(xí)教科書知識,導(dǎo)致畢業(yè)后就失業(yè)的
過去很多教培機構(gòu),在家庭心目中都是“苦讀書,勵志刷題贏在起跑線”的印象。
相對比而言,從 Luka 盧卡閱讀伙伴到 Ling 靈宇宙 AI 學(xué)習(xí)伙伴,我們一直是一個輕松快樂陪伴的品牌,科技伴(陪伴)成長,設(shè)計創(chuàng)(創(chuàng)造)想象。
說到底,靈宇宙是一家陪伴機器人公司,從工具到伙伴的 AI 進(jìn)化過程,到底孩子是需要更多的學(xué)習(xí)工具,還是一個哆啦A夢?
而我們認(rèn)為陪伴是第二步,場景是第一步,教育是場景,閱讀是場景,第一步先要找對高頻剛需的場景。
就好像 Microsoft 微軟是生產(chǎn)效率辦公軟件,而 Apple 蘋果是娛樂消費生活方式一樣,每個公司的產(chǎn)品存在,都有其邊界和定位。學(xué)而思也好、我們也好,大家專注的方向不一樣,他們是屬于那個板塊的,我們是另一個邏輯。
網(wǎng)易科技:我們現(xiàn)在的資金狀況怎么樣?
顧嘉唯:接下來我們的主要目標(biāo)是先把“小方機”鋪開,滲透更多家庭用戶。與此同時,我們也會同步推進(jìn)其他軟件服務(wù),逐步完善 LingOS 空間交互操作系統(tǒng),通往家庭機器人的路還很長。
但好在資金方面,我其實并不焦慮。原因在于我有自己的基本盤。而且這次新項目運行時,大家還是比較相信我在做的這件事的大趨勢,以及我們團隊稟賦跟這件事的匹配性,融資也進(jìn)行得比較順利,我現(xiàn)在賬上還有上百個月的資金儲備,完全可以從容推進(jìn)。
05要在技術(shù)延長線上做產(chǎn)品,過去沒做成,是因為時代沒到
網(wǎng)易科技:你覺得未來智能終端的迭代路徑是怎樣的?
顧嘉唯:終端一定會不斷出新的。你看iPhone、iPod、Mac,就是靠每年出新品維持品牌和功能的生命周期。
你說有些產(chǎn)品做出來就固化在那兒——沒有技術(shù)演進(jìn)就沒有迭代需求,它就是那一代東西了。
但我們的戰(zhàn)略是踩在 AI 技術(shù)延長線上做具有容器屬性的 AI 終端。簡單理解就是模型越來越好,數(shù)據(jù)越來越多,產(chǎn)品體驗就會越來越強,價值會不斷增長。我們會有更多新品出來,不同形態(tài)的、不同場景的終端,每年都會有新一代。
渠道鋪開后,我們本身就是一個面向全球的產(chǎn)品。未來的消費電子沒有語言邊界,跟 AI 互動,就好比Facebook 上加好友互動、你也可以加一個非洲的朋友,或者來自世界任何角落的用戶都能無障礙對話。AI的語言能力決定了它天然是全球化的。
網(wǎng)易科技:做硬件產(chǎn)品的過程中,很多時候必須做出取舍。同樣一個想法,最終因為體驗層面的決策不同,可能就會長出完全不同的產(chǎn)品。那你在這次定義這個產(chǎn)品的過程中,有哪些關(guān)鍵的取舍?
顧嘉唯:其實靈宇宙這個終端的底層邏輯,十二年前我在百度做 BaiduEye 智能眼鏡時就埋下了伏筆——之所以叫 “Eye” 而非 “Glass” ,是因為想成為人的“第三只眼”、“第二個大腦”,而非顯示的 AR 眼鏡。
BaiduEye 智能眼鏡
一個貼身的“Her”,致力于打造下一代個人計算終端 new computer 實現(xiàn)“屬于每個人的智能助理” 的命題始終未變,對我而言,這次不是重新定義,而是延續(xù)當(dāng)年未竟的探索。
具體到產(chǎn)品體驗,其實大家到時候用起來就會知道。我們最關(guān)鍵的,是給自己拉出一個足夠長的“窗口期”——能在這個窗口期里做深體驗,積累數(shù)據(jù),拉開差距。
在人機交互上,我們真正做得最深的,是兩件事:一是怎么創(chuàng)建世界模型讓終端設(shè)備跟物理世界交互(如博物館驚奇夜);二是怎么讓 AI 智能體主動跟虛擬內(nèi)容交互服務(wù)好用戶(如達(dá)爾文講解生物)。
這兩個“連接”的能力,才是產(chǎn)品體驗的關(guān)鍵點。很多產(chǎn)品你拿在手里能玩一下,但它跟現(xiàn)實世界是割裂的,跟虛擬世界又對不上,數(shù)據(jù)也不回流,那其實就是一錘子買賣,沒生命力。
網(wǎng)易科技:有沒有什么是你現(xiàn)在特別想做,但階段還沒到、暫時無法落地的?
顧嘉唯:有的,家庭機器人。
真正“什么都能干”的家庭機器人,能處理多場景多任務(wù)的通用型機器人,現(xiàn)在還不是時候。
要做這個,第一步不是堆硬件,而是收數(shù)據(jù)。就像特斯拉做自動駕駛,不是靠一套車機堆疊從無到有或突變完成的,而是靠千萬輛車的路測數(shù)據(jù)閉環(huán)體系長期積累演進(jìn)的結(jié)果。家庭機器人的核心壁壘也在數(shù)據(jù),尤其是空間交互大行為模型的價值數(shù)據(jù)。
這個依賴學(xué)術(shù)前沿的迭代周期之外,還依賴在家庭內(nèi)真實有效能率先鋪量的終端,恰恰這一點我認(rèn)為相當(dāng)關(guān)鍵,你得先有能量去鋪量設(shè)備、鋪場景,把海量對物理世界模型涌現(xiàn)智能有效的數(shù)據(jù)閉環(huán)建起來,然后才有機會拼出一個真正智能的家庭機器人。
因此為了實現(xiàn)我在“萬物有靈,人機共生”對終局消費級家庭機器人的夢想,我會分步走,先讓 AI 小方機成為下一代年輕人的“個人計算終端”,通過鋪量,積累孩子探索世界的空間交互大行為數(shù)據(jù)(基于攝像頭的全天候交互和提問回答的軌跡),打造 AGI 進(jìn)入真實世界的世界模型。
再基于這些高質(zhì)量數(shù)據(jù)訓(xùn)練用于具身智能大腦的多任務(wù)處理和動作行為推理能力,逐步拼出家庭機器人的雛形,這就像是“點物賦靈”的終極圖景,正在一步步展開。
網(wǎng)易科技:你回頭看,有沒有什么是你覺得如果當(dāng)年早點做,今天會不一樣的?
顧嘉唯:我們都知道往往前沿科技投入,都是從早期緩慢增長到快速突破,再進(jìn)入成熟期。商業(yè)化拐點往往出現(xiàn)在曲線的中后期,即技術(shù)平庸期,此時技術(shù)已足夠成熟且成本可控。
Bill Buxton 有句話讓我印象深刻“l(fā)ook back into the future(回望未來)”,他是微軟研究院我的 mentor,因為技術(shù)拐點與商業(yè)化拐點的關(guān)系并非線性對應(yīng),但往往是螺旋式上升的,周期規(guī)律本質(zhì)上是科學(xué)原理驗證、工程化突破、市場需求匹配的動態(tài)博弈。
如今帶“機器人”標(biāo)簽的產(chǎn)品仍有巨大迭代空間。比如已成標(biāo)品的掃地機器人,本質(zhì)是小家電邏輯;而教育機器人則屬于“教育服務(wù) SaaS”模式,通過 AI 技術(shù)破解師資稀缺與個性化教學(xué)難題,以多模態(tài) AI 交互終端結(jié)合內(nèi)容云服務(wù)實現(xiàn)效能升級。
掃地機器人率先以輪式形態(tài)進(jìn)入家庭,將主婦從家務(wù)勞動中解放出來;而陪伴機器人有望通過 AgentOS 驅(qū)動的人機交互能力,讓家長告別“帶娃費媽”的困境,真正實現(xiàn)「be a lady」的生活狀態(tài)。
其實當(dāng)年我們做服務(wù)機器人時,就意識到不能局限于掃地功能,而應(yīng)聚焦環(huán)境交互與人機對話,但受限于行業(yè)技術(shù)成熟度未能實現(xiàn)。如今多模態(tài)大模型技術(shù)的突破,讓人機交互迎來范式轉(zhuǎn)移 —— 從過去的“智障對話”升級為“萬物有常識、萬物可交互”。
同時 AIGC 技術(shù)重塑了內(nèi)容生產(chǎn)關(guān)系,中腰部內(nèi)容生成的技術(shù)門檻降低,讓技術(shù)型公司獲得與傳統(tǒng)內(nèi)容公司平權(quán)的機會。特別是在兒童教育領(lǐng)域,生成式 AIGC 能激發(fā)孩子的「增強想象力」,通過互動創(chuàng)作替代單向灌輸,這種內(nèi)容交互模式的拐點已經(jīng)到來。
人機交互,是我們積累最厚的能力。今天多模態(tài)大模型技術(shù)的溢出紅利,讓我做好這件事的時機到來了,right time,right people 很關(guān)鍵,但今天顯然不一樣了,人機交互范式轉(zhuǎn)移了。
回頭看,整個行業(yè)曾錯失 AI 機器人的核心價值 —— 人機交互。
掃地機器人雖出貨量大,但作為“非人機交互型設(shè)備”,僅在無人時工作,無法積累高質(zhì)量交互數(shù)據(jù)。而真正的智能機器人,必須以自然交互為核心,這正是我們通過多年技術(shù)積累與當(dāng)下大模型紅利所抓住的機遇。
網(wǎng)易科技:那你覺得,現(xiàn)在AI陪伴設(shè)備的機會真的到了嗎?
顧嘉唯:是的。這個行業(yè)現(xiàn)在終于有紅利了,市場關(guān)注度也在起來。家長真的期待新的AI設(shè)備出現(xiàn),但不是那種隨便搞搞的毛絨玩具加語音問答。
你看最近市面上那些“AI玩具”,都太粗糙了,沒體驗、沒數(shù)據(jù)閉環(huán)、沒交互邏輯,最后淪為紅海之卷,沒差異化,沒毛利空間,退貨率奇高,說白了大都是“大模型套殼”也就算了,關(guān)鍵問題是對技術(shù)發(fā)展沒有認(rèn)知,對用戶市場沒有洞察。
而我們,其實一開始就看清了兩條路:一個是AI進(jìn)入虛擬世界的交互系統(tǒng),一個是AI進(jìn)入物理世界的代理系統(tǒng)。
這兩條路徑?jīng)]變,只不過今天的大模型能力終于讓它們變得可實現(xiàn)了。
網(wǎng)易科技:你覺得未來的人機關(guān)系會是什么樣子?
顧嘉唯:未來,人類生活中大量的任務(wù)都會由機器完成。養(yǎng)老看護(hù)、帶娃陪伴、情感交互,甚至性,都可能是由機器來承接和解決的。
繁衍生育是刻在DNA里的,是動物性的,不婚單身帶娃,孩子更需要陪伴成長“學(xué)伴”的帶娃機器人;另外,生老病死規(guī)律,養(yǎng)老看護(hù)需要端茶倒水陪護(hù)照料,老人需要互動情感陪伴“老伴”的康養(yǎng)機器人,這些都有巨大的市場。
通過 AI 機器伙伴地加入,我們可以讓人類的人際關(guān)系變得更簡單。讓人類騰出精力,向內(nèi)探求精神世界身心靈,向外探索宇宙的奧秘,靈宇宙的使命就是推動新一輪的人機關(guān)系,在精神世界和物質(zhì)世界實現(xiàn)雙重陪伴。
現(xiàn)實中,一個家庭可能有六七口人,上有老下有小,各種復(fù)雜關(guān)系堆疊,婆媳矛盾、育兒分歧、養(yǎng)老壓力…… 而機器可以承接處理這些最復(fù)雜、最容易引發(fā)沖突的部分。
AI 真正有價值的地方,就是在于讓人際關(guān)系“減負(fù)”,回歸本真的情感連接,而不是被瑣事消耗。人生一回,短短百年,愿我們都能遇見有趣的靈魂陪伴每個人,有用的機器人服務(wù)每個家。讓陪伴更美好。這是我們的愿景。
換句話說,人機關(guān)系的建立,其實是在為簡化原本人和人之間的人際關(guān)系。這既是回應(yīng)“人類生來對抗孤獨”的問題,也是在推動人際關(guān)系回歸簡單。
從人機交互的學(xué)術(shù)研究,到人機關(guān)系的探索實踐,這正是過去十多年我從技術(shù)到產(chǎn)品的濃縮總結(jié)。
AI beings 數(shù)量將超越人類,將成為人類的助手、學(xué)習(xí)導(dǎo)師、玩伴、親人等多樣性角色,并將適應(yīng)所處環(huán)境而形成無窮多樣的具身個體。AI beings 具備“靈智和身體”、“身份和角色”、“社交關(guān)系”,將成為人類社會重要組成部分。
機器智能會主動服務(wù)你,會幫你解決各種現(xiàn)實問題——像是你的傭人、管家、司機,幫你訂票、做飯、采購等等。
過去,我們學(xué)會了使用計算機和互聯(lián)網(wǎng),開拓了世界,提升了認(rèn)知;未來,世界是我們的,也是AI機器人的,但歸根到底是會使用 AI 機器人的人的。
不要感嘆,生娃太早,生命科學(xué)發(fā)展很好,活得更久,很多工作不需要我們?nèi)プ隽耍煤眉彝シ?wù)機器人,帶娃保姆機器人,機器人育兒嫂,讓我們活得更好。
這個過程中,不一定是一個單體通用人形機器人來解決所有問題,而可能是家庭中分布著形態(tài)各異的機器人,各自解決不同的問題。這就是我們對未來人機關(guān)系的設(shè)想。
網(wǎng)易科技:如果要實現(xiàn)你說的這些愿景,現(xiàn)在最關(guān)鍵要解決什么問題?是數(shù)據(jù)的問題嗎?
顧嘉唯:大模型之所以在這幾年起來,是有其必然性的。早期是數(shù)據(jù)量不夠,到了一定階段,模型能力又跟不上。如今數(shù)據(jù)、模型和算力基本上都到位了,所以這才進(jìn)入了快速發(fā)展的階段。
而在 AI 走入物理世界的過程中,我們目前還處在“第一次采數(shù)據(jù)”的階段。數(shù)據(jù)依然不夠,算力也還不夠,所以我們還需要時間。
你可以看到,有些公司如果能在當(dāng)下階段真正掌握住關(guān)鍵的數(shù)據(jù)資產(chǎn)的采集路徑,未來是有很大空間的。而我自己,也算是在牌桌上活到了今天,還能繼續(xù)高質(zhì)量地活著。
網(wǎng)易科技:你覺得現(xiàn)在“活著”最重要的是什么?
顧嘉唯:仰天立地,不忘初心。既要仰望星空,又要腳踏實地,三步拆五步地執(zhí)行,經(jīng)營能力和商業(yè)能力健全,做務(wù)實的理想主義者。
得能把產(chǎn)品賣出去,能把公司的現(xiàn)金流做起來。不能總是依賴資本輸血,得讓技術(shù)夢想落地生根,這才是長久之道。
避開 “通用大模型”和“具身人形” 的喧囂,聚焦兒童場景做垂直領(lǐng)域優(yōu)化,用硬件載體智能終端讓 AI 從虛擬走向具身。務(wù)實不是 “妥協(xié)底線”,而是 “拆解理想為可執(zhí)行的階梯”。
從大廠創(chuàng)新時 BaiduEye 智能眼鏡到二次創(chuàng)業(yè)后的 Ling 靈宇宙 AI 小方機,從 “無屏觸控交互” 到 “物理世界大模型” 的進(jìn)化,我希望理想在技術(shù)迭代中自我更新。
而這條路的實現(xiàn),必須以理想為精神錨點,將務(wù)實視為 “抵達(dá)理想的方法論”,路徑必須步步為營。
可以說,從 Luka 盧卡到 Ling 靈宇宙,每一步都是我在務(wù)實中按計劃推進(jìn)理想的拼圖。