Perplexity CEO Aravind Srinivas 近日在接受 TheVerge 采訪時表示,「Perplexity 最終的目標是構建像 Windows、Mac、Android 或 iOS 這樣的操作系統,操作系統才是最終極的戰場。」
上個月,Perplexity 宣布要進軍瀏覽器市場,即將推出一款名為「Comet」的自有瀏覽器。Srinivas 認為,「誰能擁有最豐富的用戶上下文信息,誰就能贏得記憶能力的競爭。ChatGPT 對用戶在 Instagram 或 Amazon 上購買了什么一無所知,它也不知道用戶在不同網站上花費的時間。要想實現真正深入的用戶個性化,必須要擁有所有這些數據。這不僅僅是基于檢索歷史查詢來推出簡單的記憶功能,因為后者是很容易被復制的。」
而通過瀏覽器獲取用戶在不同應用和網站上的全面上下文信息(如交易、瀏覽歷史),將是實現深度個性化和構建 Agent 的最佳途徑。
大家都想成為 AI 時代的 Chrome。有傳言稱, OpenAI 也正在研發其自有的瀏覽器。
在 TheVerge 的最新的一篇采訪文章中,Srinivas 分享了其與 Motorola 的合作、如何與 Google 抗衡、以及為什么要做瀏覽器等。
Founder Park 正在搭建開發者社群,邀請積極嘗試、測試新模型、新技術的開發者、創業者們加入,請掃碼詳細填寫你的產品/項目信息,通過審核后工作人員會拉你入群~
進群之后,你有機會得到:
高濃度的主流模型(如 DeepSeek 等)開發交流;
資源對接,與 API、云廠商、模型廠商直接交流反饋的機會;
好用、有趣的產品/案例,Founder Park 會主動做宣傳。
Perplexity 創始人兼 CEO Aravind Srinivas 正在與科技巨頭 Google 展開較量,力爭讓其 AI 助手 Perplexity 得以預裝在 Android 手機中。與此同時,這位 CEO 正將其這家初創公司的戰略重心,轉移至他預判將成為 AI 領域下一個重要戰場的陣地:網頁瀏覽器。
Srinivas 向 TheVerge 透露,Perplexity 計劃下個月推出一款名為「Comet」的自有瀏覽器。他解釋說:「我們之所以開發瀏覽器,是因為這可能是構建 Agent 的最佳途徑。」 他進一步闡釋:「瀏覽器本質上是一個容器化的操作系統。它能夠讓你在已登錄狀態下,通過隱藏標簽頁訪問其他第三方服務,在客戶端抓取頁面數據,并能代表用戶進行推理和執行操作。」
事實上,也有其他 AI 公司也在朝這個方向探索。例如, OpenAI 的 Operator 和 Google 的 Mariner 都需要借助瀏覽器來執行指令和控制網站。 OpenAI 至今尚未發布自家的瀏覽器,但有傳言稱其正在研發中。與此同時,鑒于美國政府此前判定 Google 在搜索市場構成壟斷, Google 可能面臨被迫出售 Chrome 瀏覽器的壓力。
Perplexity 的一位高管曾表示,如果 Chrome 瀏覽器從 Google 剝離, Perplexity 希望能接手運營。而 OpenAI 也對此表達了興趣,老牌公司 Yahoo 也對購買 Chrome 有興趣。盡管 Chrome 的未來尚不明朗,但針對 Google 的反壟斷審查無疑為 Perplexity 帶來了機遇,使其得與 Android 手機制造商洽談分銷合作。
近期,Motorola 宣布 Perplexity 將預裝在其新款 Razr 手機上。對于 Srinivas 所稱的人工智能「答案引擎」而言,這意味著潛在的數百萬新增用戶。他坦言,盡管此次集成并非他與 Motorola 最初期望的那樣深度,但對于 Perplexity 這類規模較小的初創公司而言,他仍視其為一次重大突破。
01
通過分銷和合作來撬動Google 的主導地位
Q:能否詳細談談與 Motorola 的合作是如何促成的,以及你們在與 Google 競爭中遇到的挑戰?
Srinivas:當我們向 Motorola 展示今年一月我們推出的 Perplexity Android 助手演示時,合作洽談進程明顯加快了。在 Motorola 試用后,發現該助手運行穩定可靠,遠勝于 Google 的 Gemini 。同時,他們對預裝我們的應用并推送通知提示用戶將 Perplexity 設為默認助手表現出了極大的興趣。但 Google 介入阻止了他們,明確表示如果 Motorola 不將 Gemini 設為默認系統,就不能使用 Play Store 和官方 Android 版本發布新手機。
正如前面提到的,如果 Google 沒有經歷 DOJ 的審判,這次合作就無法實現。他們會故技重施,向眾多 OEM 廠商施壓。我曾與一些電信運營商溝通,他們甚至因為擔心一旦被 Mountain View 注意到會導致營收分成受損,而不敢與我們進行任何實質性接觸或安排會議。
Motorola 如果要更改默認設置,需要多達七八個步驟。這足以說明 Google 在 Android 生態中仍握有強大的控制權。
Q:手機廠商三星也是你們的投資者。按理說,這應該會促成某種合作,就像你們與 Motorola 宣布的那樣,對嗎?
Srinivas:是的,我非常希望我們能找到合作的方式。至于由誰獲得默認地位,或者是否會作為用戶首次設置的環節,這一切都還在探討中。
Q:聽起來,你非常看重通過分銷和合作伙伴關系來推動Perplexity的增長。
Srinivas:我們的態度是愿意與任何人合作。我們已經與電信運營商展開了合作,接下來希望拓展到 OEM 廠商。下一步是推出瀏覽器,并會開發 Mac 和 Windows 版本。屆時,我們也會尋求與這些平臺的 OEM 廠商合作。
就像 Google 在 Android 領域與 OEM 廠商建立了緊密關系一樣, Microsoft 在筆記本電腦領域與 OEM 廠商的合作協議甚至更為苛刻。因此,我們在這條戰線上同樣面臨一場艱難的爬坡戰。我們必須保持策略性,努力抗爭。很難找到有人會客觀地認為 Microsoft 的 Copilot 是一個比 Perplexity 更好的產品,但 Copilot 卻是 Windows 系統中唯一預裝的 AI 助手。
Q:你們剛剛在 iOS 上發布了助手,該助手的功能似乎讓很多人感到驚訝。 Apple 是否為此給了你們特殊權限來控制其他應用?
Srinivas:Apple 并未給予我們特殊權限。用戶無法通過我們的系統設置鬧鐘、啟用低電量模式、調節屏幕亮度或音量,也無法控制手電筒的開關。同樣,無法用來撥打電話或發送 iMessage 。
我們之所以能做到某些集成,是因為我們使用了 Apple EventKit SDK 。這個開發工具包開放了對 Reminders (提醒事項)、 Podcasts (播客)、 Apple Music (蘋果音樂)、 Apple Maps (蘋果地圖)以及一些其他 Apple 應用的訪問。我們能夠調用該 SDK ,并結合我們自己的搜索基礎設施和深度鏈接技術,實現與 YouTube、Uber 等應用的交互。
很多人詬病 Siri 不夠智能,但在設置鬧鐘和撥打電話這些基本功能上, Siri 是可以正常工作的。 Siri 的不足之處在于,它無法準確找到用戶想要的歌曲、播客和 YouTube 視頻,無法設置更智能化的提醒,也無法便捷地叫到 Uber 網約車。我認為, Perplexity 在后者的這些使用場景上做得非常出色。
02
構建操作系統級 Agent,
瀏覽器是最佳「容器」
Q:你們開發瀏覽器的原因是什么?以及何時會推出?
Srinivas:正如之前所說,我們開發瀏覽器的原因在于,這可能是構建「Agent」的最佳途徑。在 iOS 和 Android 這樣的移動操作系統上,我們沒有系統層面的控制權,很難直接調用其他應用并獲取它們的信息。雖然可以通過深度鏈接跳轉,但比如在 Uber 的例子中,我無法便捷地比較不同 Uber 車型(如 Comfort )的價格,即使價格差異不大。我無法對比 Uber 和 Lyft 的價格來找到最優選擇。我也無法比較 Uber Eats 和 DoorDash 的送餐等待時間來確定最佳點餐方案。
因此,我們需要構建一個具備操作系統級別能力的 Agent。而瀏覽器本質上就是一個容器化的操作系統。它能夠讓你在已登錄狀態下,通過隱藏標簽頁訪問其他第三方服務,在客戶端抓取頁面數據,并能代表用戶進行推理和執行操作。這種架構設計正是我們所看重的。
未來,Agent 能夠簡單地回答用戶問題將變得像商品一樣普遍,不再具備差異化優勢。我們需要在執行行動的能力上建立新的競爭壁壘,這正是我們構建瀏覽器的初衷。瀏覽器是幫助用戶采取行動的最佳平臺。我們希望將用戶交互界面轉移到一個新的前沿陣地。
03
跨平臺用戶個性化數據是關鍵,
構建 AI操作系統才是終極目標
Q:你們是否擔心 ChatGPT 的巨大規模,以及它對許多用戶而言已經足夠好,以至于他們不會再嘗試Perplexity? ChatGPT 還在通過記憶用戶交互和實現個性化來建立用戶的粘性。
Srinivas:我認為 OpenAI 的策略,至少從 Sam Altman 在接受 Ben Thompson 采訪時的表述來看,是鼓勵第三方應用集成「使用 ChatGPT 登錄」按鈕,然后通過這種方式將所有用戶數據匯入 ChatGPT 。但這需要說服所有第三方應用都能提供這一登錄選項。
Perplexity的策略是讓用戶可以在他們當前使用的應用中保持登錄狀態。我們將通過構建瀏覽器,在客戶端代表用戶訪問各種應用。
我認為,誰能擁有最豐富的用戶上下文信息,誰就能贏得記憶能力的競爭。ChatGPT 對用戶在 Instagram 或 Amazon 上購買了什么一無所知,它也不知道用戶在不同網站上花費的時間。要想實現真正深入的用戶個性化,必須擁有所有這些數據。這不僅僅是基于檢索歷史查詢來推出簡單的記憶功能,后者是很容易被復制的。
真正困難的是如何以跨平臺的方式,將用戶的交易記錄、購物歷史、瀏覽歷史以及你在瀏覽器上的所有數據,無縫導入到AI助手中。這就是為什么我們不僅需要在網頁端開發瀏覽器,也需要在移動端開發,并在所有應用之間共享 cookie 。這是我們面臨的巨大挑戰。
Q:聽起來你認為瀏覽器是你們構建的產品的「終極目的地」?
Srinivas:不止于此,我們最終的目標是構建像 Windows、Mac、Android 或 iOS 這樣的操作系統。瀏覽器相對受限且容器化。操作系統才是最終極的戰場。
04
融資、競購TikTok、訓練數據問題
Q:你們曾因抓取內容而引發不少出版商的不滿。現在你們已經開始向其中一部分出版商支付費用。你們認為目前與出版商的關系是否已是良好的狀態,還是仍有待進一步改善?
Srinivas:我認為還有更多工作要做,但現在的情況比我們上次溝通時已經好很多了。我們在抓取時嚴格遵循了 robots.txt 協議。對于任何不允許我們抓取的內容,我們都只依賴第三方數據提供商提供的數據。
Q:據報道,你們正在以 180 億美元的估值籌集數億美元資金。你們計劃如何使用這筆資金?
Srinivas:要想可靠地構建 Agent,需要利用最前沿的推理模型。當前成本高昂的技術,在一年后很可能變得非常便宜,但我們不能等到那時。我們需要盡快將這些能力推廣給盡可能多的用戶,以便收集海量數據,將其提煉壓縮到更小的模型中,從而降低運營成本。
Q:關于競購 TikTok 的進展如何?最近是否與白宮有過溝通?之前曾有關于你們如何籌集資金的疑問。
Srinivas:我還沒有放棄競購,但我認為自己贏得的幾率并不高,這一點我想大家都很清楚。我不認為資金是主要問題,有足夠的投資人愿意支持我。
我們從 ByteDance 方面聽到的消息也并非是關于資金的擔憂,更多是關于他們是否愿意放棄對算法的控制權。我認為他們希望保留所有權和控制權,并且相信沒有人能比他們做得更好。而且,在美國和歐洲運行的 TikTok 應用在技術架構上緊密關聯,很難完全解耦。未來,關稅等貿易政策也將影響一切,包括 TikTok 的命運。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.