作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
你多久沒換過主力瀏覽器了?或者說,你知不知道瀏覽器其實是可以更換的?對許多人而言,瀏覽器就像電燈,每天都會打開,卻又熟視無睹。幾十年來,從開先河的Mosaic到如今幾乎壟斷市場的Chrome,瀏覽器那張“臉”,幾乎就沒怎么變過:地址欄、書簽、刷新按鈕——一套雷打不動的組合。我們早已習慣,甚至麻木。主流瀏覽器提供的功能,對絕大多數人來說,已經足夠好,但似乎也足夠“無聊”了。
然后,AI 來了。這個沉寂已久的領域開始發生變化。AI裹挾著終端設備、操作系統、應用,乃至芯片的加速進化,瀏覽器也站在了變化的中心,不再甘心只是網頁的容器,而是試圖掙脫舊的軀殼,成為更多。
1
瀏覽器,正在被 AI “重新發明”
在AI這把火點燃之前,很難在瀏覽器市場掀起浪花。少數巨頭早已劃定了勢力范圍,用戶也幾乎容不得任何偏離常規的設計。即便是那些打著“生產力提升”旗號的新產品,也大多因為一點點體驗瑕疵或關鍵擴展的缺失,在一波嘗鮮用戶之后就被打回原形。但現在,游戲規則似乎變了。
一批最有野心的AI創業者正帶著不同的劇本沖了進來。他們不再滿足于給瀏覽器打個 AI 補丁,在側邊欄加個聊天框。他們的目標更為根本——用AI徹底重塑瀏覽器的核心邏輯,改變我們與互聯網互動的方式。簡單來說,他們想讓瀏覽器擁有自己的“大腦”和“雙手”,替你“思考”,更能替你“行動”。
首先是The Browser Company(TBC),這家公司的名字本身就帶著明確的野心。TBC的第一款產品Arc就是融入了AI功能的瀏覽器,而他們推出的新產品 Dia 瀏覽器,則拋出一個更具顛覆性的愿景:“AI 不會僅僅是一個應用或一個按鈕……它將是一個構建在瀏覽器之上的全新環境。” TBC認為AI將構成新的計算環境的基礎,而瀏覽器將是其核心。看看他們想讓 Dia 干的事,或許就能理解這句話的意思。
設想一下,你不再需要在不同應用和網頁間手忙腳亂地切換,只需在 Dia 的地址欄用大白話下達指令——“幫我找到上周那份關于市場趨勢的報告,然后用郵件發給張三”,更進一步,“幫我把這些東西加到亞馬遜購物車”,瀏覽器也能代勞。
理想和現實之間總是有一些距離。Dia目前的早期版本,離他們第二支宣傳片中那種能替你辦事的AI似乎還有十萬八千里,有人犀利地指出它在一些產品細節上有些亮點,但“本質上就是在 Chrome 上加了一層 ChatGPT 的外衣”。
Dia瀏覽器并未采用 Arc 瀏覽器的縱向標簽欄(Arc的核心創新之一)設計,而是重新使用了用戶熟悉的橫向標簽頁模式;首頁設計極其簡潔,只保留了一個輸入框,提供 Google 搜索和 Chat 兩個選項。
Personalization功能可以優化的預設Prompt,可設置你的語言偏好、表達風格,AI會智能調整以匹配。但實際上無論你如何嘗試個性化Dia,它給人的感覺依然像是ChatGPT。
那個號稱能查看頁面上所有內容的AI側邊欄功能,實際上任何非純文本內容,都無法讀取,反而會試圖編造答案。
創始人Josh Miller在X上引以為傲的案例是用戶可整合多個標簽頁的上下文執行復雜任務,例如根據一個標簽頁內容撰寫文檔卻采用另一標簽頁的排版風格,或將打開的標簽頁轉換為對比表格和報告。
Josh Miller稱之為極致上下文建構(tripling-down on context),這也是它試圖區別于其他 AI 產品(比如 ChatGPT、Copilot、Perplexity)的關鍵。他認為AI 在瀏覽器里的關鍵不是模型多強,而是有沒有完整的上下文能喂給它。
從Josh Miller透露的產品規劃來看,Dia想做的是一個會成長的AI交互層,它學習你的習慣、自動適配你的任務。
如果說Dia和它背后的公司還披著一些“文藝”的外衣,那Fellou就顯得更“工科直男”一些,這兩個產品在理念上有些相似之處,而Fellou在產品實現上甚至更進一步,打出“世界首款代理式瀏覽器 (Agentic Browser)”旗號。它的核心概念是“代理式深度行動 (Agentic Deep Action)”。這話聽起來比 Dia 的“全新環境”更“技術流”一些,但內核如出一轍:讓瀏覽器更主動、更深度地介入你的工作流。
Fellou聲稱,它的AI Agent不僅能幫你處理公共領域的開放數據,還能深入你的“私有領地”(比如本地文件或需要登錄的平臺),進行復雜的研究和信息編譯。更誘人的一點是,這些任務可以在一個“影子窗口”中悄無聲息地執行,不打擾你正在進行的“主要工作”——當然,也可能不打擾你“摸魚”。
例如,我們讓Fellou根據需求去電商上找一些商品推薦的選項,它的操作步驟和常見Agent類產品一樣,區別是會在本地的瀏覽器中執行,因此可以讓用戶登陸相應的網站賬號,從而進行跨平臺檢索,最后會輸出一份可視化呈現的報告。
完整報告:https://chat.fellou.ai/report/7bd96eee-385d-4b46-a12e-cdb66516f25d
Fellou還可以自動化執行一些任務,任務自動化:能夠自動執行重復性或復雜的在線任務,比如打開亞馬遜將商品添加到購物車、會議預訂等。我們讓Fellou打開小紅書,給硅星人最新的一條筆記留一條評論:
Fellou成功的執行了任務,全程的操作過程如下:
視頻經5倍速處理
不過從用戶的反饋整體看來,其自動化任務執行的穩定性有待提升,比如即使同樣的任務,也不能保證每次都能復現,復雜任務可能出現中斷或錯誤,由于環境是在本地,處理大量標簽頁時,可能出現卡頓或響應遲緩的情況。
Perplexity也是試圖革新瀏覽器的重磅玩家,正在推進其瀏覽器產品Comet的開發,Perplexity2025年2月宣布正在開發Comet,5月中旬進入封閉Beta測試階段。
從有限的測試者反饋看,Comet支持從Google Chrome導入書簽、密碼等數據。測試版中,用戶可通過“Comet助手”下達指令,實現關閉/打開標簽頁、分組標簽頁、關閉重復標簽、查看購物車、幫助查找未回復郵件等功能。
CometBeta版截圖
Comet會根據用戶的瀏覽歷史和打開的標簽頁(所有數據均本地存儲,不用于模型訓練)提供個性化響應。它還將Perplexity的核心搜索功能集成到側邊欄中,可在所有網站上訪問,使用戶無需切換標簽頁即可查詢、總結或探索內容。
此外,Comet的電子郵件邀請函中強調了諸如分析收件箱、準備面試以及生成會議記錄等使用場景——這些功能旨在“每周節省數小時”。
當然,也有用戶對Comet提出疑問,質疑其開發獨立瀏覽器的必要性,如果只是為了集成那些AI功能,其實完全可以在現有Perplexity網頁或插件上實現,無需另做一個瀏覽器 。
整體來看,Comet的愿景可總結為短期內穩步推出產品、完善AI瀏覽體驗,長期則瞄準打造“瀏覽器即操作系統”的生態。在Srinivas看來,回答問題的AI能力終將成為各家必備的基礎功能(commodity),真正的競爭優勢將來自于幫助用戶執行操作。
他明確表示,開發Comet瀏覽器是公司長遠戰略的重要一步,其最終愿景是構建一個類似 Windows、Mac或Android/iOS的全能AI操作系統,“我們的計劃是開發一個操作系統,讓用戶幾乎可以在其中完成一切”。
值得注意的是,Perplexity 已公開表示將利用這些豐富的用戶數據來構建用戶畫像,并用于推出高度定制化的廣告和服務 。Srinivas 在采訪中坦言,這是他們打造瀏覽器的原因之一:“我們想獲取應用之外的所有數據來更好地理解你……例如你購買了什么、去哪些酒店、瀏覽哪些內容,這些信息能更全面地告訴我們你的情況” ,這引發了不少網友對隱私的顧慮。
顯然,從驚艷的概念到無縫的體驗,Dia、Fellou和Comet們還有很長的路要走,不過他們展現出的核心理念本身,就已經捅破了傳統瀏覽器功能的天花板。
1
巨頭在行動
眼看AI創業者試圖重新發明瀏覽器這個古老物種,巨頭們自然也不會坐視不理,只不過巨頭們的動作顯得更為復雜。
微軟算是其中動作最快的一個。Copilot全面植入Edge瀏覽器,目標清晰明確,將Edge打造為為每個人服務的AI伴侶。無論是幫你快速總結冗長的網頁內容,輔助你潤色措辭生硬的郵件,還是根據你的瀏覽習慣提供個性化的信息流,Copilot都在努力讓Edge顯得更智能、更貼心。
這是一種典型的“微軟式”打法——利用龐大的生態系統為 Edge 導流并提供整合體驗,通過AI增強現有功能,提升用戶粘性。與其說是創造一個全新的瀏覽器物種,不如說是給成熟的Edge瀏覽器裝上一個更強大的AI引擎。
相較之下,谷歌Chrome的AI化上則顯得更加謹慎。Chrome的體量實在太大了,任何激進的改動都可能牽一發而動全身,影響數以十億計的用戶乃至其核心商業模式。因此,谷歌更多是將AI能力以一種更“潤物細無聲”的方式融入搜索、廣告等核心業務,瀏覽器本身的AI功能迭代則相對謹慎。
然而,這并不意味著谷歌對AI瀏覽器的未來掉以輕心。一個頗具玩味的細節是,在美國司法部針對谷歌的反壟斷案中,當“剝離Chrome”作為一種可能的處罰被提出時,幾乎所有你能想到的科技巨頭——包括OpenAI——都毫不掩飾地表達了對Chrome的“濃厚興趣”。這赤裸裸地揭示了瀏覽器作為互聯網核心入口的戰略價值,在AI時代只增不減。誰掌握了瀏覽器,誰就掌握了塑造未來互聯網體驗的主導權。
而作為當前AI技術變革的頭把交椅,OpenAI的思路則更加“釜底抽薪”。盡管有傳聞稱其對收購 Chrome抱有幻想,但OpenAI的核心戰略似乎并非從頭再造一款瀏覽器,而是要通過其日益強大的基礎模型和正在研發的AI Agent產品Operator,Operator通過在OpenAI的服務器上操作遠程瀏覽器來完成任務,它更像是Siri的未來形態,或者說是數字化“管家”。
梳理各方的路徑可見,但還需要一些突破;微軟谷歌這樣的巨頭則希望通過AI強化現有生態和用戶體驗,創業公司們在用AI的理念嘗試從根本上顛覆瀏覽器,最終瞄準的都是深層次的交互革命。
1
“下一代操作系統”的陽謀
要理解為何這些 AI 瀏覽器創業者和科技巨頭都將目光投向“操作系統”這一宏大目標,我們可以回到瀏覽器的誕生初衷。1989 年,蒂姆·伯納斯-李爵士創建萬維網(WWW),其核心是為了滿足科學家、高校及研究機構間便捷共享信息的需求。瀏覽器的出現正是為了簡化這一過程,因此,它最初是圍繞“文檔”設計的,將互聯網視為一個巨大的文檔庫,而瀏覽器是訪問這些文檔的工具。這一核心理念至今未變。
然而,隨著生成式 AI 的興起,我們開始看到網頁內容本身的“原子化”。AI 可以將信息從固定的文本、圖片、視頻等文檔格式中解構出來,按需進行分析、總結、提煉,并重新組合成個性化的答案或內容。這本身就在削弱萬維網最初“鏈接文檔”的設想及其構建方式。如果信息不再以穩定的、可供鏈接的“文檔”作為基本單元存在,而是以更碎片化、更動態的方式呈現,那么瀏覽器——這個傳統上用來訪問文檔的工具——又該如何實現它一直以來的核心功能呢?
曾在Netscape任職的Flipboard創始人兼CEO Mike McCue認為,正如瀏覽器為適應移動優先的世界而“扭曲”成了某種應用形態一樣,以個性化、交互性、對話為核心的人工智能系統,將迫使瀏覽器再次進化。AI正在重塑我們接收和處理信息的方式,隨之變化的必然是承載信息的“容器”,瀏覽器本身、其底層的協議、以及我們與之交互的界面,它們都將發生演變。
有野心的創業者們都敏銳地捕捉到了這一趨勢,并試圖通過 AI 瀏覽器來引領這場變革。他們看到了傳統瀏覽器在處理日益復雜和動態的信息、以及用戶跨應用任務需求方面的局限性,并試圖通過 AI Agent、深度上下文理解和任務自動化來彌補這些不足,將瀏覽器從一個靜態的信息展示工具轉變為一個動態的、智能的個人數字助理平臺,這與操作系統的功能定位高度契合。
不過,這些新產品面對的挑戰也是巨大的。目前許多 AI 瀏覽器產品,在核心技術層面(至少在用戶可感知的層面)顯得高度同質化,很大程度上依賴于現有的基礎模型能力。Sam Altman說,大學生們傾向于將AI視為一種新型的“操作系統”。而這種“操作系統”式的使用方式,一個深度個性化、無處不在、能主動理解并協助你完成各種任務AI助手,正是OpenAI努力的方向——OpenAI也不會放過這個掌握新時代的入口的機會。
Josh Miller 也表示,“如果 Sam Altman 來模仿,我們再想應對辦法。” 這些創業者們已經意識到,自己面對的不只是Chrome這些瀏覽器,而是同樣懷揣著“下一代操作系統”野心的OpenAI這樣的巨頭們。對Dia,Fellou和Comet們來說,機會的確是巨大的,提出概念來卡住一個位置之后,接下來的競爭只會更加激烈。
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.