大模型的序章結束了。
模型的故事發生了一些微妙的變化,比如,沒人敢說中國模型不行了。
所有投資人都告訴我們:「這個真的要感謝 DeepSeek」。
也要感謝 Manus,他們最先搭出了一個產品,證明了產品的技術棧正在變復雜。復雜會帶來多元,多元意味著更多可能性。
Manus 也證明了一句大家前兩年還有點心虛的話:應用是中國公司的主場。
變化有目共睹,或許「下半場」的判斷還為時尚早,但這一定是新的篇章,Chapter 2。越來越多的應用創業者下場,老牌的美元 VC 重新活躍起來,消費、硬科技、純人民幣基金開始頻繁找 AI 項目,大洋對岸的美元也開始悄悄關注中國創業團隊。
我們啟動了這個項目。
過去幾周,Founder Park 訪談了十多家投資機構,美元、人民幣、大廠戰投、新成立的基金。這些活躍在一線的投資人們,不論年齡、資歷、title,他們積極甚至激進。感謝他們的信任,我們在交流中收獲了極高密度的信息和洞察。經過我們的梳理,將部分可公開的對話整理成文,希望能為當下的 AI 創業者提供一些有參考價值的思考。
在投資和創業的 context gap 中,希望這樣的彌合工作有它的意義。
一些訪談碎片
模型不是 VC 的 game,DeepSeek 已經教大家怎么做模型了。
今天要求創始人在 Day One 就想清楚是不對的。技術還沒收斂,更重要的是不停 build 不停交付的能力。
把 AI 玩具做得 fluffy,是一條危險的捷徑。
ComfyUI 是一個非常社區化的產品,它的生命力來源于社區。所以,答案可能還是要去社區里尋找。
Plaud 年收入超過 7000 萬美金。Plaud Note 這種形態的產品,已經出來快兩年了,在今天的市場上,我好像找不到第二個競爭對手。為什么?
創業者早期拿太多錢可能會讓動作變形。早期張一鳴拿了多少錢?現在很多背景不錯的創始人,一出來就是幾輪,有點重現當年最瘋狂的時候,華貿一天閉環,三輪結束了啊。
1 萬付費用戶,你就是頂級 AI 產品。
ARR 概念誕生的時候,是為了「擠水分」的。游戲公司要不要也算個 ARR?
Prosumer 的產品,審美、風格和細節是專業用戶的無止境追求,也是創業公司的機會所在。
垂直領域的 AI Agent 絕不能按過去投中國 SaaS 的邏輯去看。中國 SaaS 市場這么些年,中國投資人交了這么多學費,它很清晰的特點是為結果付費,而不是為效率工具付費。
很多時候我們拒絕,是覺得創始人自己并沒有真正進入「創業狀態」??赡苄判暮陀職獾搅?,但整體動作、思考深度還沒到。事可以變,但創業狀態不對,在這個時代會非常困難。上了戰場就下不來了。
我覺得最值得做的,還是找到創始人自己真正為之興奮的事,而不是到某個「范式」而去里面做填空題,我們還是更喜歡看到創業者能做一個 「供給創造需求」 的事,這應該會很開心。
Manus 辦公室有張海報,是推特截圖,大意是:一個硅谷 VC 朋友說,Manus 讓他想起了硅谷黃金時代的 「old silicon valley」—— No secrets, just sheer execution speed。 (沒有秘密,只有純粹的執行速度)。
以下是出現在這篇訪談中的投資人們:
Alphaist 創始人 - 陳哲(ex 五源)
Atypical Ventures合伙人- 邵帥
創新工場執行董事暨前沿科技基金總經理- 任博冰
Creek Stone 創始人 - 李一豪、鐘陸歡(ex 弘毅)
高瓴創投合伙人- 王蓓
錦秋基金合伙人- 臧天宇
靖亞資本創始合伙人- 何沛
明勢創投合伙人- 夏令
線性資本董事總經理- 鄭燦
真格基金合伙人- 劉元
特別說一下,兩家新成立的基金,從五源出來的陳哲做了 Alphaist,從弘毅出來的李一豪、鐘陸歡做了 Creek Stone。新基金的 GP 很有趣,他們也成了創業者。
采訪 | Nico
編輯 | Nico、萬戶
?目錄
1. Manus 的成功對創業者有什么參考價值?
2. DeepSeek 究竟改變了什么?
3. 大模型六小虎,接下來如何?
4. 「模型即產品」是共識嗎?Workflow 公司怎么辦?
5. 元寶登陸微信,會復制拼多多的成功嗎?
6. 為什么最成功的 AI 原生硬件 Plaud 沒有人抄?
7. ARR 指標對創業公司重要嗎?
8. 通用 Agent 是創業公司的機會嗎?
9. Agent 會如何改變傳統 SaaS 的模式?
10. AI Coding,中國創業者有什么機會?
11. AI 陪伴玩具,為什么做不對?
12. 泡泡瑪特的玩具不會說話
13. 怎么看朱嘯虎關于「具身智能」的觀點?
14. AI Infra 比云計算時代更復雜,有變化就有機會
15. 視頻生成可靈領先了,但整個行業都還在 early adopter 階段
16. 手機廠商做 AI,對創業公司來說是好事
17. 對創業者 say no 的原因是什么?
18. 未來半年,早期創業者最應該做什么?
19. PMF 的有效期變短了,M 變復雜了
20. 下一代內容平臺長什么樣?
21. Alphaist 和 Creek Stone,為什么要出來做新基金?
22. 機構當下的投資策略是什么?
23. 市場上的好項目變多了還是變少了?
24. 投資人的角色正在發生變化
25. 最近在思考哪些問題?
本文為合訂版本,各位投資人單獨的訪談原文,我們放在飛書知識庫里供參考。
https://geek.feishu.cn/wiki/XitKwsKJqiZie8kNPVLcVoVynKe
01
如何定義 Manus 的成功?
Founder Park:Manus 作為一家AI應用創業公司,引起了全球范圍內的關注,公司也順利拿到硅谷 VC 的投資。它對中國其他創業公司有怎樣的參考意義?
創新工場任博冰:Manus 有兩點很有意思:
全球化營銷:作為一家中國公司,通過產品和營銷策略迅速獲得了全球范圍的認可,這是一件很難的事情。很多中國公司嘗試過,但影響力往往難以持久。
海外融資:它探索并走通了「中國公司美國融資」這條路,這對我們很有參考價值。
Monica 這個團隊本身也值得研究。肖弘、Peak、張濤,這家公司從最初的連續創業,到 24 年其實有一段時間沒有找到第二曲線,后來 Peak 和張濤加入,做出來新東西,這個路徑也非常有研究價值,對我們在看新的公司時很有參考意義。
錦秋基金臧天宇:他們能在北美拿到融資,我覺得是多方面因素促成的:
Manus 團隊的努力是最重要的。他們通過 PLG 的方式實現了有效的增長,有非常陡峭的增長斜率,對于國內團隊引起硅谷機構的認知是非常重要的。
海外也有一些機構會比較反共識地看好中國新一代創業者的能力和出海潛力,他們會做很深度的 coach,也會帶來一些資源。AI 放大了優秀 Founder 的能力邊界,這會是一個英雄輩出的時代。 Manus 團隊就是典型的 AI 時代的創業者畫像。錦秋要做的,就是做他們最堅實的后盾和戰友。
線性資本鄭燦:Manus 首次將多種現有(包括剛出現的)AI 能力,特別是模型推理能力整合在一起,提供了一個處理復雜、長程任務的驚艷體驗。之前的 Devin 體驗較差,Deep Research 雖然體驗好,但任務形態相對單一。Manus 則展示了處理多樣化長程任務的可能性,這個體驗非常漂亮。
Manus 之前他們花了些時間探索,我個人理解,是內部在不斷調整以尋找 PMF 的過程。
Manus 本身可能不需要特別大量的人手花超過半年的時間開發,但關鍵在于團隊把握產品方向和及時調整的能力,尤其是在技術快速迭代的環境下,這非常重要。面對一個「all moving pieces」的局面,他們沒有死磕最初的想法,而是在任何時間點都選擇一個當下最有可能爆發的產品方向和攻擊角度,持續調整,直到找到 Manus 這個突破口。這種在技術變化進程中的 pivot 能力很強。
真格投了肖弘四次,why?
Founder Park:真格投資 Manus 的邏輯是什么?你們很早就知道他們要做 Agent 嗎?
真格基金劉元:如果按「投 Agent」的邏輯去找項目,永遠不可能投到 Manus。
我們歷史上投了肖弘四次,從他上一個項目開始。
第一次創業:上一個項目,大家都知道了。(壹伴助手和微伴助手,公眾號運營工具,后賣給獨角獸公司。)
第二次創業(蝴蝶效應)天使輪:方向是做中國的 Benchling(生物科學領域 SaaS,估值 60 億美金),我們投了天使輪,那時還沒產品。
第二輪融資:主要產品是 Monica 插件,買了 ChatGPT for Google(Chrome 插件)。當時 Monica 剛開始做。那時有人說這是「套殼」,沒技術含量。
第三輪融資:主產品是 Monica.im(多端跨平臺 AI 助手),收入已經不錯了。當時團隊跟投資人講的故事是想做「AI 瀏覽器」,很多投資人并不看好這個故事。
這個過程充滿了演進和轉型。它不是一個典型的「Agent 公司」做出來的產品。
就像小紅書,我們 9 年投了 4 次。如果你當年是想投「最好的內容電商」或「最好的內容社區」,你也不會找到小紅書。它最早做的產品是 PDF 攻略,跟內容、電商、社區都沒太大關系。
Founder Park:蝴蝶效應 Pivot 了三次,真格都參與了。在不斷轉型中,你們具體看到了什么特質?
真格基金劉元:他不是三次山窮水盡被迫轉型,而是三次主動取舍。
做類 Benchling 時:我們看到他用很少資源,在自己不算最熟悉的領域,做出了可用性和審美都很好的產品。
轉向 ChatGPT for Google / Monica 時:我們看到他不僅有能力做出高質量產品(類 Benchling 產品做出來但沒發),還能「壯士斷腕」,砍掉它去追逐更大的機會。這種戰略取舍和執行力很牛。同時并行開發 Monica 并取得增長,證明了他的多線程能力。
Monica 壯大,構思瀏覽器時:我們看到他抓住機會,在短時間內把 Monica 在海外做到了相當大的用戶和收入規模。他一個很少出國的人,做出純海外用戶的大體量產品,這非常厲害。雖然瀏覽器沒發,但再次證明了他對產品的極致要求和戰略定力。
所以,這三次轉型,我們看到的都是他的進步,信心是越來越足的。Manus 的出現,感覺是水到渠成。
歷史上,真格很多成功案例都經歷了激烈轉型。從 PC 時代的聚美優品(從游戲轉型電商),到 Anna(方愛之,真格基金創始合伙人)投的小紅書,再到最近上市的地平線(真格也是天使投資人)。
Founder Park:Pivot 是創業中的重要命題。從你們的觀察來看,成功的 Pivot 有沒有一些共性或方法論?
真格基金劉元:首先我自己沒領導過轉型,可能沒有資格談。但從觀察的視角,成功的轉型往往不是因為原來的事做不下去了,而是在原有業務還不錯、甚至很順利的情況下,敏銳地發現了一個更大的機會,然后主動選擇。
比如肖弘的轉型,Jasper(AI 寫作工具)的轉型,都是在實踐中真切地看到了一個更大的浪潮,然后決定去追。小紅書也是這樣。這種觀察往往是獨特的,因為你身處實踐之中,別人看不到。
而不是說 A 做不了了,放棄,然后從零開始想 B。很多時候,轉型是在已有基礎上,看到了實踐中涌現的、別人未必看得到的獨特機會。
Founder Park:所以思考 Pivot,不是只在 0-1 或 1-10 不太順利的時候,反而是在居安思危的階段?
真格基金劉元:理論上是,但越往后,轉型的沉沒成本越高。如果當時第一個產品已經上線,有了很多用戶和收入,他要砍掉去做完全不同的事,心理負擔肯定會重很多。
Founder Park:團隊在 Monica 的哪個階段開始孵化 Manus?
真格基金劉元:瀏覽器產品當時其實已經做完了,我們甚至在一些內部活動展示過。但團隊不滿意,覺得它「長得太像瀏覽器了」,AI 時代的瀏覽器,不應該「長得像瀏覽器」。Manus 從某種意義上說也是個瀏覽器,但形態完全不同。
Founder Park:做完發出來,好像也沒什么損失?
真格基金劉元:對,類 Benchling 那個產品做好了,我也跟肖弘說過,掛出去試試唄,有人用就用,沒人用就算了。他不發,就是不發。瀏覽器也是,我們都測試過,提了意見,他還是覺得不對,硬是沒發。這就是 CEO 的決策和取舍,他們對自己要求非常高,覺得沒達到想要的那種「different」的效果,就不出手。
Founder Park:Monica 是顛覆大家對「套殼」理解的非常重要的一款產品。
真格基金劉元:對,這點肖弘非常牛 x。我記得他在 Manus 發布前一個月還發過一條即刻,「相信我,殼有殼的用處?!?/p>
Founder Park:蝴蝶效應這家公司的成長路徑對其他創業者有什么參考意義?
真格基金劉元:肖弘他們沒有什么驚艷的背景,就是大學生創業,參加創業協會、黑客松,拿點天使投資。他的每一步,其他創業者并非遙不可及。不像有些天才創業者,你會覺得「哇,那是天才」。
肖弘就是一步一個腳印,像蝸牛一樣往上爬。他一個國內團隊,沒什么海外背景,做出了全球產品;非技術大牛出身,做出了 Jack Dorsey、Andrej Kaparthy、Thomas Wolf 都在轉的產品;吸引了非常厲害的人才。
他經常說「平凡人做不凡事」,招人也不迷信光環。這說明了實踐、在環境中學習、迭代的重要性。
02
DeepSeek 改變了什么?
Founder Park:DeepSeek 爆火是今年最重要的黑天鵝事件,它改變了什么?
創新工場任博冰:DeepSeek 改變了中國研究型公司的標準,不僅是商業化,還有影響力。
我們最近有跟很多科研機構交流,也包括一些企業,比如阿里的 Qwen 3,影響力是重要的標準。國內很多人工智能研究院,把 Paper 的標準也改了,甚至不發 Paper 也能畢業,教授不需要太多引用量也可以獲得大量的經費支持。Tech report、開源項目,這些好的成果都沒法用量化的方式判斷,有些開源項目的 star 數可能水分很大。真正好的東西,大家自然會知道,不用刻意制定標準。如果你糾結如何評價,可能只是因為東西還不夠好。
這是一個多年來大家心知肚明的問題,只是過去不愿意承認。(DeepSeek 事件)讓大家意識到,其實學術圈的問題不止是算力的問題,還是機制的問題,甚至是目標管理方式的問題。很多研究不需要那么多算力,而且最近,很多學員也拿到了非常多的算力。大家都在自我反思,追求第一性地做科研,做企業。DeepSeek 對整個國內的 AI 生態,不論是科研還是企業的目標,都帶來了非常良性的變化。
線性資本鄭燦:DeepSeek 帶來了幾個關鍵變化:
1. 降低門檻與成本:它本身能力很強,處于第一梯隊。開源讓大家有機會自行托管(host)或找到第三方托管,從而顯著降低使用大模型的成本。一個有趣的現象是,在 2024 年一整年,H200 GPU 的租金都在下降,但 DeepSeek 發布后,美國 H200 GPU 的租金上漲了 10%。
2. 促進小模型發展:開源模型讓開發者可以更低成本、更放手地去蒸餾(distill)出性能更好的小模型,這對開發者生態是極大的利好。
3. 普及推理能力:DeepSeek 出來之前,除了 OpenAI,還沒有公司做出來推理模型。它的出現直接刺激了各大廠紛紛推出自己的推理模型。更重要的是,DeepSeek 完全開放了思維鏈,這為訓練推理能力更強的模型提供了寶貴的、廣泛的訓練數據。已經有團隊在利用 DeepSeek 的思維鏈數據訓練自己的模型了。這本身就是對行業的貢獻。
4. 加速 AI 商業化:DeepSeek 的影響力,尤其是其強大的能力和開源特性,大大降低了 AI 的客戶教育成本。去年很多企業,包括大型企業,還在猶豫是否要用 AI,業務部門需要費力說服老板。DeepSeek 之后,這種討論和說服變得容易多了,很多企業開始主動詢問「我們該怎么用?」,甚至「先不管那么多,搞一個來試試」。這直接推動了 AI 的商業化進程。
Deepseek 證明了 L2 對 L1 產品的降維打擊
明勢創投夏令:DeepSeek,尤其是 R1 帶來的生態影響對我們影響很大。如果參考 OpenAI 提出的 AI 能力 L1-L5 分級,其實已經明確來到了 L2 階段:
L1:Chatbot(對話)
L2:Reasoner(推理解決問題)
L3:Agent(調用工具完成復雜任務)
DeepSeek R1 和 OpenAI 的 o 系列可以看作是 L2 級別的模型和產品。L2 的出現,對 L1 級別的產品是降維打擊。之前積累的 DAU、工程優化等在 L2 面前可能不堪一擊。這對我們的啟示是:
1. L1 層面的競爭已無意義,必須升級。
2. L3(Agent)何時到來變得至關重要。我們已經看到 L2 對 L1 的沖擊,L3 來了,對 L2 又是降維打擊。
春節后我們跟國內和海外大模型公司交流,他們給出的 L3 時間點是超出我們預期的,他們普遍認為是一年之內,甚至更激進的認為可能就在 2025 年內就可以發展到 L3 階段。
對投資組合的意義:
模型公司:持續加大投入,像 MiniMax,24 年下半年就已經調整策略,模型要追求更高上限,瞄準 L3。
產品型公司:如果還停留在 L1,現在面臨的最大問題是你的 L2、L3 是什么?必須前瞻性思考和布局,否則當前的投入很可能無效。
Manus 是一個 L3 產品的雛形。雖然在測評中比分高的部分并不是嚴格意義的 Agent,他們對于需要多步推理和使用多種工具的任務完成度仍較弱,效果肯定滿足不了大家的需求,但它驗證了 L3 Agent 產品形態的趨勢,它的出現肯定會對 L2 產品形成沖擊。
對產品型公司來說,最迫切的是:
盡快思考 L2/L3 形態是什么:做規劃,明確時間表,哪怕是直覺驅動的,調整產品規劃和資源分配,向 Agent 方向演進。
厘清與模型公司的關系:大多數產品型公司不具備自研模型能力。今天的模型公司正在持續提升自己的模型能力和模型邊界,提供模型、推理、Memory、工具等,提供一個完整的 System 而不是一個簡單的 Model,目標是 Agent 能完成人 80% 的工作。這種情況下,產品公司應思考如何利用模型公司的能力成長,而不是跟他們直接競爭。
聚焦專業領域:尤其是「Save Time」類產品,應盡可能面向專業人群、專業領域,避開模型公司能力邊界擴張帶來的直接沖擊,要考慮到模型公司能力和邊界的擴張對你的業務的影響。
03
大模型六小虎,接下來如何?
Founder Park:對于現有的「六小虎」等模型公司,怎么看后續發展?MiniMax 的前景如何?
明勢創投夏令:我們 2022 年初投資 MiniMax 的時候,大模型還是非共識。一年之后當共識形成,對我們而言就過了早期投資階段,2023 年起所有新成立的大模型創業公司我們均沒有投資。
時至今日,對于仍堅持做模型的公司,要跑出來,前提是模型能力持續保持在第一梯隊。這需要:
1. 充足的資源:錢、卡。
2. 強大的工程化能力和高人才密度團隊。
3. 戰略清晰:認識到模型需持續追求技術上限,產品的歸產品,不要以短期 DAU 等為導向,要有戰略的判斷和調整。
我們依然堅定看好 MiniMax,因為它:
調整早:去年下半年已完成模型優先的戰略調整,而不是在 DeepSeek 之后。
資源足:是國內創業公司中人才團隊、現金儲備、算力集群規模領先的公司之一。
產品能力強:多個產品在細分領域保持全球領先。
MiniMax 同樣也將模型技術開源,并做了前沿探索,比如 在 Transformer 底層有自己的創新,非共識的在國內走 Linear Attention 路線從而支持 long context 的「大海撈針」命中率極高,這在 Agent 階段會越發重要。
Founder Park:真格投了 Kimi,怎么看?
真格基金劉元:Kimi 到今天,還是初創公司里最執著于去拼 SOTA 模型、搶奪「皇冠上的明珠」的那一個。
所以到今天,雖然競爭日益激烈和收斂,回頭來看投資月之暗面仍然是作為一個 VC 最好的選擇。
Founder Park:過去兩年,資金主要集中在模型層。現在模型公司融資似乎遇到挑戰,那接下來,市場上的資金會流向哪里?
Alphaist 陳哲:反正我覺得不應該投模型,(我在之前的基金)一個模型都沒投。我覺得模型不是一個 VC 生意,從 VC 的角度去做這個事情沒什么意義。
移動互聯網時代,真正浪潮起來的時候,也沒有很多人真的跑去做操作系統。你看上個時代,真正有底層平臺型機會(算力、OS)的創業公司里面只有小米一家。華為 OV 都是老公司,而且當年都是直接 follow Android 生態。為什么今天大家覺得一個創業公司可以去把技術模型的生態給做起來呢?我當時沒有想明白。移動互聯網真正出現機會的時候,其實是各種各樣新鮮的小東西會出現。我覺得今天跟當年的情況有點像。
VC 這個行業,就像我基金的名字(Alphaist),VC 永遠是在尋找 Alpha。VC 肯定不是一個尋找 Beta 的游戲。
因為你要獲得 venture 回報,你一定就需要 下注一個大家沒有那么看好,或者大家不太敢 bet 的事情。那核心就是你必須找到這里面的非共識,必須找到這邊的 Outlier。我覺得這是 VC 這個游戲的本質,所有好的 VC Deal 都是這么出來的。所有 Party Round 的就沒有好 deal。這是本質,但是大家會覺得不舒適,因為這個東西太反人性了。
Founder Park:集中的大額投資,比如過去兩年的六小虎,現在也階段性結束了。
Atypical 邵帥:這其實涉及到在不同創新階段的投資邏輯。
在理論創新階段,(如 OpenAI 早期探索語言模型的 Scaling Law,或固態電池研發等),風險極高,不確定性也大,因此更適合產業資本或非盈利組織,比如馬斯克和 DeepSeek 的模式,這不是 VC 的菜。
在技術創新階段(如近兩年大模型技術路線逐漸清晰,大家開始卷算法、工程、訓練方法),VC 們可以開始進入投資,但主要還是少數技術精英的游戲,技術壁壘仍然較高。
在產品創新階段(技術門檻相對降低,重點轉向如何將技術組合成應用,創造用戶價值),這也是市場最大的紅利期,也是 VC 的主戰場。此時,投資的重點回歸到產品、用戶需求和商業模式這些基本面上。
我們現在正處在從技術創新向產品創新過渡的關鍵拐點。這個階段將涌現大量機會,是早期 VC 的最佳時機。但也正因為如此,優秀項目將變得更加搶手,估值水漲船高。這對早期基金提出了更高的要求,要看得更早,決策更快,更果斷。
靖亞資本何沛:在投大模型的時期,市場關注的是中國能否誕生 OpenAI 這樣的世界級 AI 公司,所以頂級的 AI 學者或科學家會大受青睞。但有這種背景和能力的創業者數量是少的。
現在大家的關注點已經從大模型轉到了應用層。應用層創業的邏輯是完全不同的,頂級學者或大廠背景出身并不必然等同于能做出優秀產品。如今,大家似乎又回到了同一起跑線,比拼的是對場景的深刻理解、對用戶的精準洞察以及產品創新能力。理論上大家都有機會,我覺得創業項目會很多的。
Founder Park:過去兩年投大模型是在尋找中國的「OpenAI」,現在結論趨于清晰,VC 又回到了更擅長的領域,識別人、找到合適的應用場景?
靖亞資本何沛:是的,之前投大模型公司是為夢想(AGI)投資,現在頭部公司已經拿了非常多的錢,再投新的公司意義不是很大。但應用層投資才剛剛開始,目前看到的跑得快的 AI 公司收入起量快得驚人,也會刺激 VC 的情緒。
應用層的投資邏輯,不是大模型領域投人才的稀缺性,而是要找到好的場景、找到真正懂用戶、能做出用戶愿意花錢買單的產品的創業者。我們更想投「有理想但不理想化」的創始人。
04
「模型即產品」是一種錯覺
Founder Park:怎么看 GPT-4o 和 Gemini 2.5 Pro 帶來的「模型即產品」的討論?
Alphaist 陳哲:GPT-4o 和 Gemini 2.5 Pro 做出這個結果也不奇怪。我去年年底去灣區的時候,跟幾個 Google 的前同事(陳哲此前在 Google X,負責 Google Glass 的工作)聊過。我的感受就是Google 做出這個東西完全符合預期,而且 Google 還有更多的東西沒放出來。他們在多模態模型的訓練、數據和清洗這方面的能力已經遠超市場上的公司了。
這些可能還是反映了一個事情:基礎模型,尤其包括未來的多模態,以后的具身,在模型框架開始收斂的情況下,那肯定是誰有算力、誰有數據就會更有優勢。目前真正有算力、有數據的就這幾個大廠,所以他們得出這個結果我覺得完全不奇怪。創業公司應該更早地想明白,如果這個是個必然的結果,自己應該找一個什么樣的位置?
高瓴創投王蓓:之所以現在大家討論「模型即產品」,是因為我們正處在模型快速迭代,而產品尚未明確交付顯著成果(deliver result)的階段。也就是說,我們處于基礎設施(infrastructure)快速演進的過程中。
這個階段看到更多的是模型自身的變化,就是基座模型,包括語言模型、多模態模型,甚至具身智能模型,這些都屬于底層基座能力的迭代。但這是否意味著產品層面的變化?產品層面的變革才剛剛開始。
高瓴創投(GL Ventures)很早就支持了模型公司。我們是 MiniMax 的最早的投資人,那還是 2021 年下半年,當時 ChatGPT 3.5 還沒出來、大模型根本還不是融資主題。在投了幾家重要的模型公司之后,我們也一直在看產品。很多優秀的產品經理也希望能做出有特色、有亮點的 AI 產品。
為什么之前很難跑出好的產品,還是因為模型能力還不夠強。純語言交互的產品形態相對單薄,用戶更期待多模態體驗。而多模態技術(如 Diffusion Model)在過去的迭代中還不夠成熟,產品經理想利用底層模型能力做出好產品,難度很大。這就給大家造成了一個錯覺,似乎模型本身就是產品。但我們認為,未來仍然是產品的天下。
Founder Park:模型吃掉上層的框架甚至產品,比如 GPT-4o 對于 ComfyUI 等工作流帶來比較大的沖擊,做 workflow 的創業公司應該怎么辦?
ComfyUI
ComfyUI 是一款用于 AI 視頻生成的開源可視化流程工具,作為 Stable Diffusion 的插件發布,用戶可以通過節點連接精細控制視頻生成過程,并支持工作流模板的復用分享。深受專業設計人士和開發者喜愛。
ComfyUI 最早由開發者 Joshua Bardwell 個人開發,現團隊位于美國舊金山。
創新工場任博冰:技術發展是螺旋上升的。大家之前可能過于追求統一標準,但很多標準本身就是階段性的,甚至可能是錯的。就像 Agent,Deep Research 是個模型,但也可以用 Agent 實現類似功能。未來是追求單一強大模型還是復雜 Agent 系統?這沒有定論,會不斷演進。
ComfyUI 當然可以實現類似 4o 的效果,但 4o 用一個模型就解決了部分問題(圖像)。視頻生成也是如此,我們投的一家公司(本月中會發布成果)就采用了完全不同的技術路徑,不是 DiT 的路徑。
技術突破會不斷改變對工具鏈的認知。目前工具鏈的問題在于:做多模態的人太依賴現有工具鏈,并且會假設模型不會有顛覆性提升。
這兩點都是錯的。多模態模型(圖像、視頻)其實變化非??欤踔帘日Z言模型更快(從 GAN 到 Diffusion 到 AR,每次大變化也就兩年左右)。大家之前太關注語言模型而忽視了這一點。
因此,創業者需要:
1. 工具鏈的冗余度:工具鏈設計必須有巨大的冗余度,能容納未來的技術突破。
2. 定義新產品:要追求實現之前無法實現的新產品形態,而不是簡單地用現有模型和工具復刻舊產品。比如,現在做 AI 短視頻,很多 Agent 方案可能都有問題,因為未來直接生成可能就不需要那么復雜的 Agent 了。工具的目的是服務于新形態的視頻,甚至定義新的視頻類型。我們即將發布的新視頻生成技術,其產出物就和之前的視頻不是一回事,工具鏈自然也要隨之改變。
關鍵在于團隊對創業方向的定義:我到底在解決什么問題?這對工具類公司尤其難。很多人基于現有內容平臺和形態去做工具,短期能吃到紅利,但這如同在沙灘上蓋城堡,一旦內容平臺或形態變化,工具價值就可能消失。
需要在短期紅利和長期風險間找到平衡。既要吃短期紅利,也要在架構和內容形態上留有足夠冗余。不能讓現有的工具定義你的技術路徑 。
錦秋基金臧天宇:ComfyUI 的用戶主要是專業設計師或 AI 創意工作者。對他們來講,GPT-4o 提升了圖像生成質量和語義理解,但 ComfyUI 提供的節點式工作流、對生成過程的精細控制、本地化部署、隱私友好等特性,可能仍然是無法完全替代的。GPT-4o 可以作為 ComfyUI 工作流中的一個強大節點,而不是完全取代它。而且 ComfyUI 支持的不只是圖像生成,還有視頻生成等,我們投的一些視頻工具團隊也在使用它。
所以,我不認為 GPT-4o 的能力會簡單地顛覆 ComfyUI 或基于它的應用生態。
Coding 領域的 Devin 本身也是一個 Agent 應用,它不是底層模型。它是在好的底模基礎上,構建了一個面向專業編程場景的 Coding Agent 應用。模型能力的提升(比如 Claude 3.7)反而直接提升了 Devin 這類應用的性能。這恰恰說明了在強大底?;A上構建優秀工作流應用的價值。
Devin
Devin 是 Cognition AI 的核心產品,頭部 AI 編碼工具。2024 年 12 月,Devin 開啟商業化,針對 Team 客戶收費 500 美元/月。
Cognition AI 于 2024 年在美國舊金山成立,創始人兼 CEO Scott Wu,華人創業者,曾擔任 Lunchclub 聯合創始人兼首席技術官及在 Addepar 軟件工程師。2024 年 4 月,拿到來自 Founders Fund、Khosla Ventures 1.75 億美元投資,估值達到 20 億美元。
線性資本鄭燦:ComfyUI 是一個非常社區化的產品,它的生命力來源于社區。所以,答案可能還是要去社區里尋找。
雖然長得像 ComfyUI 的工具很多,但它是大家最喜歡的產品之一。GPT-4o 的確提升了圖像生成的基線水平,但它肯定也有解決不了的問題。這些問題,最終可能還是需要社區的力量去解決。正是因為 ComfyUI 建立了強大的社區,當它受到新技術沖擊時,其內部反而會因為社區的活力而產生新的生命力。它的生命力就在于社區。
Coming Next...
5. 元寶登錄微信,會復制拼多多的成功嗎?
6. 為什么最成功的 AI 原生硬件 Plaud 沒有人抄?
7. ARR 指標對創業公司重要嗎?
8. 通用 Agent 是創業公司的機會嗎?
9. Agent 會如何改變傳統 SaaS 的模式?
10. AI Coding,中國創業者有什么機會?
11. AI 陪伴玩具,為什么做不對?
12. 泡泡瑪特的玩具不會說話
13. 怎么看朱嘯虎關于「具身智能」的觀點?
14. AI Infra 比云計算時代更復雜,有變化就有機會
15. 視頻生成可靈領先了,但整個行業都還在 early adopter 階段
16. 手機廠商做 AI,對創業公司來說是好事
17. 對創業者 say no 的原因是什么?
18. 未來半年,早期創業者最應該做什么?
19. PMF 的有效期變短了,M 變復雜了
20. 下一代內容平臺長什么樣?
21. Alphaist 和 Creek Stone,為什么要出來做新基金?
22. 機構當下的投資策略是什么?
23. 市場上的好項目變多了還是變少了?
24. 投資人的角色正在發生變化
25. 最近在思考哪些問題?
05
元寶登陸微信,
對創業者來說意味著什么?
Founder Park:您之前從業,領投了拼多多 B 輪,非常早期。現在很多人把拼多多的成功歸因于微信入口。最近也看到騰訊的元寶在微信里推廣,您怎么看微信這類超級入口對創業者的影響?尤其是一些想在微信生態里做事的創業者?
高瓴創投王蓓:提到拼多多,大家都覺得是因為微信。但實際上,我 2015 年認識黃崢和他的公司,應該是第一個認可「拼多多」這個概念的投資人(之前是「拼好貨」)。其實翻看當時的投資報告,里面完全沒有「微信生態」這四個字。
我們當時投的邏輯,更多是一個詞:信噪比,信息和噪音的比率。一個好的產品,如果在任何環境下都能體現出更高的信噪比——用戶看到不反感,覺得有用——那它就能成功。不管今天載體是微信、微博,甚至是短信、飛信,只要是在人與人可以溝通的環境里,它能提高信息傳遞效率和決策效率,它就能成。
我們當時花很多時間去還原拼多多到底是什么?我們還原的是菜市場和早市。你看到一群人在搶菜,你路過時總會多看一眼。那這個菜市場,是不是就是大家的「微信」呢?(笑)
還是那句話,太陽底下無新事。很多模式和場景幾百幾千年前就有了,我們只是在當下找到一個合適的載體。能快速發展的唯一原因,就是你的信噪比高。
Founder Park:所以遷移到現在的AI領域,如果騰訊利用微信能力做對了,無可厚非;如果沒做對,那就是創業者的機會?
高瓴創投王蓓:對。誰能在這個技術變量上更好地抓住機會,利用好當前所有的信息傳遞渠道(比如社交媒體),解決信息不對稱問題,誰就能成功。信息從不對稱到對稱的過程,也是用戶和數據量級變化的過程。任何人抓住了這一點,無論大廠小廠還是創業者,都有機會。拼多多在海外沒有用微信同樣也做得很好。
只要在人類信息傳遞的載體里,你能找到對用戶有用的點,讓他覺得這個東西有用,就能成。
Founder Park:很精彩的視角。
高瓴創投王蓓:沒有,其實也說不出什么高大上的詞,就是很樸素的道理,能說明白就行。
06
為什么 Plaud 沒有競爭對手?
Founder Park:AI原生硬件,過去兩年成績最好的應該是 Plaud Note,2024 年年收入 7000 萬美金。
Plaud Note
Plaud Note 是 PLAUD.AI 的首款產品,AI 智能會議紀要錄音筆。Plaud Note 是全球首款搭載 GPT-4 的 AI 錄音筆,交付超 30 萬臺,采用了「硬件+訂閱」并行的收費模式,年化收入達到一億美金。
PLAUD.AI 于 2021 年在美國成立,由許高創立,許高是一名連續創業者和投資人,曾投資早期 FA 機構小飯桌。
Alphaist 陳哲:Plaud 應該有接近百萬的銷量。我覺得它與其說是硬件產品,可能軟件的部分占比還更大一些,因為它的硬件相對簡單,ID 設計和工業復雜度來說,作為硬件產品來說還是比較簡單的。
雖然它可能只有大幾十萬的量級,但對一家小公司來說,兩年時間取得接近一億美金的成績,硬件+軟件,作為一個小公司,而且不是特別擅長做智能硬件的團隊,其實是一個很不錯的成績。
可能很多投資人剛看到 Plaud 這個產品的時候,都很難想象他能做到大幾千萬美金的收入,還有千萬美金級的 recurring 的收入,還有六七成的毛利。
這就有一個我最近在思考的問題:Plaud Note 的競品,在市場上很少。一個超薄的、iPhone 錄音的配件,結合 GPT 的能力,這種形態的產品,它已經出來快兩年了,在今天的市場上,我好像找不到第二個競爭對手。為什么?
當然它吃了硬件的紅利,智能錄音筆不是一個新的產品,科大訊飛和搜狗都做過,科大訊飛的錄音筆有幾十億的收入規模,這不是一個新品類,而且沒有 AI 總結,錄音筆是一個「難用」的產品,只有文字轉寫,很難做出有用的價值。GPT 能力的普及讓錄音筆這個產品更有用了,Plaud 作為一個小團隊取得了非常成功的結果,也驗證了這個需求的存在。
Plaud 的切入,用了一個超薄的電池,超薄的 ID,是為了和 iPhone 配合,作為手機配件。
但今天很多人用它,跟手機已經沒有太大關系了。大家沒有把它貼在 iPhone 上用,反而當成一個正常的錄音筆,好看、設計巧妙、很容易收納,你可以放在錢包里,很容易攜帶使用。在這個邏輯下,今天的市場上我真的找不到第二個好產品,我也想找個替代品試試,但找不到。
可能有人會 argue,小米會做,安克會做。我相信有很多品類,比如智能眼鏡,小米華為肯定會做,有幾十個公司沖進去做,但也沒有哪家實現幾千萬美元的收入,而且毛利還低,因為供應鏈把成本控制得很厲害。
我的一個邏輯是,Plaud 是華米 OV 肯定不會做的事情。 為什么呢?因為它不是一個億級的 toC 產品。錄音筆本來就是個百萬到千萬級的商務級產品。這種產品在大廠里面立項是非常困難的。想象一下小米做一個 Plaud 的山寨,就算做出來賣個一兩百萬臺,會很難受,在內部一點不解決問題,那個負責人會被罵死的。這種方向丟給小米生態鏈公司,他們都不一定會正兒八經去做。
所以,有些方向是一定大廠會做的(比如智能眼鏡、手環),但有些方向就是大廠真的是愛莫能助,因為內部的衡量機制和激勵不鼓勵他們做這樣的事情。這就給創業公司留下了空間。
Founder Park:Plaud 后來做了一個 pendant 掛墜,這個領域很多人在做。
Alphaist 陳哲:Pendant is all bullshit,沒有一個公司做得稍微成功一點。我當時在 Google Glass 的時候,各種可穿戴形態,我們都嘗試過。Pendant 真的是個很糟糕的形態,它放在胸前,你的心跳都會對它有干擾,那個收音的位置,各方面都差很多,但架不住大家會前赴后繼地嘗試。
Founder Park:確實很多人在做,可能對比 Plaud 這種偏極客、商務,掛墜會有所謂女性向的市場。
Alphaist 陳哲:這是假設。這個產品并不難,12 個月的周期肯定能做出來,那就等 12 個月以后,看看能賣多少。能不能真的賣出去,能不能真的打動用戶?如果不能,這個假設就是錯的。
Founder Park:你會建議創業者做 Plaud 這種形態嗎?
Alphaist 陳哲:倒沒有建議大家做,更多是好奇大家如何思考這個問題,如何選擇路線。我發現,很多創業者,尤其技術型創業者,他們喜歡做 fancy 的產品。
回到兩年前,做個 Monica,可能很多人都難以啟齒,覺得沒有技術含量。實際上呢?他們做成了一個高黏性,有盈利,有持續增長的產品。
我覺得,對于 Plaud,包括我自己,作為投資人,直覺就覺得這件事太簡單了。但實際上,這樣一個簡單的東西,如果你真的切入得很好,用戶是會用的。但現在大家想各種各樣的創新,做一個漂亮的掛墜,或者一個 fancy 的 AI 眼鏡,有時候是事半功倍的。這件事我覺得很有意思,怎樣的思考決策最終導向了事半功倍的情況?
現在的創業者、投資人,應該仔細思考,有哪些 Plaud Note 這樣的機會?
Atypical 邵帥:這是一個很好的問題,有一個我想強調的觀點:不要高估巨頭,也不要低估創業公司執行速度的重要性。
很多時候,模仿者(山寨)和巨頭的行動速度遠比我們預期的要慢。舉個例子,去年其實就有一些公司想做 AI 瀏覽器,我下意識地覺得,如果這個方向真的有機會,谷歌不是應該立馬就能做嗎?但現在看,雖然優秀的 AI 瀏覽器已經出現,谷歌似乎并沒有立即做出反應。
所以,我們真的不能高估巨頭的行動力??赡苓@個方向不在他們的核心戰略中,比如巨頭可能更注重大模型的開發、通用 Agent 等方向,也可能是因為公司組織架構的老化,導致執行的速度跟不上市場變化。創業公司在這一點上反而具有競爭優勢。
回到 Plaud Note,為什么沒有人模仿它呢?
一是非共識的市場判斷,很多人至今沒有意識到「聲音記錄」本身就是一個值得重視的市場。就像音頻模型,過去大家都關注語言和視覺模型,音頻一直被忽視,直到 ElevenLabs 的出現才開始引起注意。
二是對壁壘的誤判,很多人會覺得,像會議紀要這種功能,其實飛書的妙記、手機 App 就能夠做,為什么還需要專門的硬件呢?如果它的核心依賴于轉寫能力,那么它的壁壘在哪里?但其實我覺得 Plaud 在硬件本身已經做到足夠簡單和極致了,很難在同樣的形態上再有超越,另外會議紀要的撰寫質量也依然有很多工程細節可做,包括場景的繼續加深,自動排 calendar,通知與會人等等。
三是對于小眾市場的刻板印象,語音記錄在很多行業中都有特定的解決方案,例如汽車銷售的電子工牌、藍領市場的錄音設備、傳統的錄音筆 等,Plaud Note 采用的是「硬件+軟件訂閱」的定價模式,可能會讓一些人覺得屬于一個較為小眾的市場。
即便是看到了 Plaud Note 的成功,這些疑慮也可能導致會讓潛在的模仿者或巨頭猶豫不決,最終導致它們的反應較慢。
錦秋基金臧天宇:(Plaud 沒有很多競品)首先可能跟硬件開發本身的門檻有關,從產品定義到 EVT、DVT、PVT 一系列流程,到最終導入量產,需要時間和資源,一個產品成熟至少得六個月到一年。Plaud 的產品又薄又輕,有漂亮的 ID 設計,是需要花時間打磨的,競品跟進也需要付出相似的時間成本,因此存在一個領先的窗口期。
其次,這種垂類場景也限制了模仿的空間。Plaud 在領先的這段窗口期內增長迅速,很快建立了品牌認知。你要在一個已有品牌認知、規模中等的垂類市場里,推出一個完全一樣的產品,并不是一個 ROI 很高的市場選擇。如果沒有明顯的功能差異或升級,很難撼動原有玩家的地位。而市場空間又沒有大到讓新進者砸大量市場資源去做的程度。所以它現在這個局面也不意外。
硬件的另一個問題是它不像軟件能小步快跑地迭代,一個生命周期走完了,就要準備下一個版本,中間的風險不小。
07
ARR 只是一個指標
Founder Park:最近 ARR (年度經常性收入) 這個指標很火,行業里有爭議。怎么看這個指標?
高瓴創投王蓓:ARR 最早其實是個「擠水分」的概念,但現在反而可能包含了挺多噪音。我們開玩笑說,游戲公司哭暈了,要是用 ARR 算流水,那游戲公司是不是全世界 ARR 最高的?
最重要的還是還原用戶的使用場景和行為習慣??从脩舻霓D化漏斗是怎么形成的、用戶在哪一層愿意付費、付費意味著什么?可能意味著某種程度的信任,但這只是此時此刻。
我們還要關注,用戶付費之后,留存、使用頻次、場景、時長是怎樣的?用戶用產品創造的東西,有沒有下載下來?下載之后有沒有分享?這些行為數據,可能比 ARR、比收入本身更重要。
收入往往是一個滯后的結果,前置的是高質量的用戶行為。哪怕一個產品不產生收入,但用戶行為質量很高,我們也認為它是高質量的產品。反之,如果只是通過各種手段(比如利用情緒 FOMO)促成了一個付費轉化行為,但用戶后續的使用頻次、場景并不理想,那這個轉化本身意義也不大。因此除了數據,我們也非常看重用戶調研。
Founder Park:GenSpark Agent 發布 10 天就給出 ARR 數據,其實在業內有些爭議。
高瓴創投王蓓:每家公司每一個當下的動作,背后可能有各種原因。對于創業公司來說,我們還是強調,要有足夠的同理心,要站在這個創始人和團隊的角度去想,比如它是希望讓更多人知道我、關注我的產品?還是要用時間換更多的空間機會?
Founder Park:現在整體環境比較嚴苛,很多聲音都在說創業者要從 Day One 就想商業模式,學會賺錢。
高瓴創投王蓓:很多年輕創業者(90 后、95 后甚至 00 后),他們首先希望完成一個自我認同的小閉環。比如做個東西放到 App Store,零推廣下居然有人下載、有人轉化,這對他們是巨大的快樂。這證明了 AI 或科技是一種平權運動,降低了創業門檻。我們非常樂見這樣的事情發生。
他們早期可能不需要太多錢,我們也愿意見證他們「美」的過程。很多人的野心也是迭代的,先做小而美,再想怎么變大,以及如何在變大的同時保持美。
錦秋基金臧天宇:短期內很難有大的變化,市場上的資金屬性決定了對商業化的關注度。甚至可能因為宏觀因素變得更嚴苛,比如貿易摩擦。
我們認為,創業者不一定非要在 Day 1 就實現商業化,但路徑思考是必須的。Day 1 不賺錢可以,但 Day 1 就得想明白靠什么賺錢。你是想做大 DAU 靠廣告,還是做訂閱,或是其他模式?這個思考應該從一開始就有。當然,我們(作為美元基金)可能相對市場上一些機構(尤其是人民幣基金)的要求會稍微靈活一些,但商業化本質的重要性是毋庸置疑的,畢竟創業最終是商業行為。
08
通用 Agent 在大廠射程范圍內
Founder Park:通用 vs 垂直是現在的熱點話題,有很多通用 Agent 陸續發布,但這個賽道似乎像通用模型一樣,是個贏家通吃的終局?你怎么判斷通用 Agent 和垂直 Agent 的創業機會?
Atypical 邵帥:通用 Agent 這一方向競爭異常激烈,而且它的未來充滿不確定性,畢竟它在大模型廠商的射程之內。
我個人反而更關注那些獨特且深入垂直行業的 AI Agent 應用。盡管通用 AI Agent 在許多場景下表現出色,但它也難以完美滿足某些特定行業的專業需求。比如在金融投研、法律、醫療、銷售線索挖掘等領域,這些行業對 AI Agent 的要求更加精細,需要更多專業知識、行業數據和工作流的整合。
對于創業者來說,瞄準一個 Niche Market,并深入其中,結合 AI 能力和行業的專業知識,形成獨特的工作流壁壘,可能是更為穩妥的策略,且長期來看也具有更大的價值。
Creek Stone 李一豪:從投資邏輯來看,尤其在看到 OpenAI 的 o 系列模型后,我們的重點在垂直領域。我們認為現在還沒到通用人工智能的時代,當前的追求可能受上個時代「連接」帶來巨大價值的慣性思維影響,現在更應該追求垂直智能,探索各個細分領域的「超智能」(Super Intelligence / ASI)。頂層語言模型規劃 + Computer Use 調用工具 + MCP 生態能力,但這套框架應該首先應用于垂直領域,RL 卷出超智能。The Bitter Lesson 告訴我們,深度智能來自算力的有效利用和 scaling,垂直 ASI 再到 orchestra 層面的搜索學習,才可能催生下一代更強的通用智能。
總的來說,這些事件讓我們對投資、對中國創業者更有信心,指導我們更關注各類垂直領域的機會,當然 ToC 我們也會持續高度關注。
Founder Park:你們認為AI落地進程中,Agent 的發展會先經歷垂直智能階段,然后才可能走向通用?
Creek Stone 李一豪:是的。要解決社會重要問題或推動智能向上發展,首先要在各個領域樹立起「超智能」,就像 AlphaGo/AlphaZero 在圍棋、星際爭霸中做到的那樣。理論上,像 Excel 操作、商業分析、商務拓展等領域,都應該先通過這種 Search to Learn 的方式形成超智能。有了超越人類規劃能力的絕對智能基礎,上層組合的 Workflow 才有價值。否則,簡單的流程組合很容易被模型性能的提升或深度垂直智能所碾壓。這是一個分周期的事情。
另外,我們需要更多像 MCP 這樣的關鍵組件。雖然目前看起來好像沒有太多經濟價值,但很關鍵。MCP 的成功部分源于 Anthropic 的號召力,生態中還有很多關鍵組件可以通過社區力量探索。在當前兩極化的環境下,開源生態有獨特價值,可能高通體系的、中國主導的完備方案需要各自完備一套,有可能未來會分離的,這類組件的價值未來會凸顯。
錦秋基金臧天宇:行業還沒有明確的共識。從我們的視角看:
通用 Agent:最終是跟著通用模型智能水平走的,可能是模型即產品的終極形態。當然這肯定也需要行業基建(比如 MCP)來配合。目前我們看到的這些所謂的通用產品的形態,應該離終極形態還是有差距的。然后像 Manus,可能他們現在先做成一個偏通用的形態推出來,但后邊肯定也會看到平臺上的用例更多集中在一些場景或者垂直方向上面,我覺得如果真的要迭代的話,可能后邊它也會有一些側重點。
垂直 Agent:在現階段,能夠在產品和工程層面去做的,肯定還是會垂直到某些方向上去的。比如大家討論的通過強化學習(RLHF)讓 Agent 越用越好,這需要在特定場景下才有清晰的獎勵信號和有效的數據飛輪。這在通用的平臺上現階段很難實現。
所以,我們認為 Agentic AI 還沒有收斂到某個確定的共識階段,通用和垂直路徑都有探索的空間,但現階段垂直應用的可落地性更強。
明勢創投夏令:先看事實:
模型層面:視頻生成,MiniMax 的海螺 AI 在全球流量遠超快手的可靈。文本大模型,DeepSeek 從投入量級、人員規模、卡的資源數量上看,都無法與字節、阿里等傳統大廠相比。在技術高速迭代期,并非總是傳統大廠領先。技術有非常高斜率的增長曲線,未來 1-2 年類似于 o 系列或者 R1 這樣的突破不會只發生一次,而且不僅會發生在推理能力。一個事實上的結果是,視頻模型、文本模型的突破都不是傳統意義上大廠做出來的,大廠往往做的還是共識的事情。
產品層面:元寶、夸克等確實承接了用戶流量,數據增長很不錯,驗證了我們在泛 C 通用應用上大廠有優勢的判斷。
對創業公司來說,要區分產品類型,大家喜歡把產品分成 save time 和 kill time 兩類,還可以分成 ToC 還是做 ToB 。
如果做 To C 通用型 Save Time Agent,在中國,這對創業公司挑戰巨大,對技術和資源的要求很高。它與自研模型能力緊密綁定,且現有巨頭的身位很好,比如阿里夸克、騰訊元寶。除非(創業團隊)能像 DeepSeek 一樣引領下一代模型技術迭代并且能拿到流量,否則機會渺茫。
我們更關注 To C 的專業領域和垂直場景的 Save Time Agent,以及 Kill Time Agent,后者也會成為 Agent 形態,但往往核心壁壘是在平臺效應、社交活動等等上面。
我們的觀點不變:
規避國內泛 C 用戶通用的 Save Time Agent 市場。
聚焦專業人群、專業領域,增長可以非常快。比如我們投的某個垂直領域 AI Agent,一年時間在國內做到了 1000 萬美元 ARR。垂直領域競爭對手不是互聯網大廠,而是細分領域的傳統玩家,而且在中國有相當多細分領域的玩家都是小散。AI 在這里有機會重塑業務流程,實現業務標準化、結構化從而實現規?;?/p>
Kill Time 領域: 也有機會,比如 MiniMax 的星野,數據依然好于字節的貓箱。核心在于,內容平臺重要的是雙邊,要抓創作者。星野抓住了關鍵 OC 人群,從之前的 Glow 開始,他們既是消費者也是創作者,形成了平臺效應。
大廠合作: 事實上,互聯網大廠在 Q1 密集地通過投資+業務扶持來支持一些 AI 應用公司。它們并非純粹的競爭關系。
Founder Park:Agent 公司都需要有自己的模型才能構建壁壘嗎?
真格基金劉元:兩年前投資人們都覺得模型可以吃掉一切,但到現在看并沒有。你看 Perplexity, Cursor 這些,用戶量都不小了,他們都沒有自己的模型。
從自下而上的用戶需求出發解決問題,和自上而下分析「護城河」,視角是很不一樣的。大家總愛問技術壁壘,但歷史上哪個成功產品一開始就有牢不可破的技術壁壘?Uber? Facebook? 壁壘(用戶、網絡效應、運營)都是后驗的。做學校社交網絡的不止 Facebook,憑什么說 Facebook 才有網絡效應?這些都是后驗的,不能通過后驗的信息尋找前置的判斷。
Scaling Law 也是一樣,三五年前有多少人信仰 Scaling Law?從 Pre-training 到 test-time compute,每年的發現和判斷都跟前一年完全不一樣,假設本身就在不斷顛覆,當下的假設從來都不是亙古不變、從來如此的,無法被挑戰的。
我的意思是,技術壁壘的權重經常被嚴重高估,許多壁壘是靠日積月累的工程鑄就的,不是靠天才靈光一現參透的秘密。不僅僅是技術迭代快,更重要的是你對用戶和產品的理解、洞察是不是夠細膩、夠快、夠準。中國最大的那些互聯網公司,哪個的技術是當時別人完全無法復現的?我覺得沒有。
Manus 辦公室有張海報,是推特截圖,大意是:一個硅谷 VC 朋友說,Manus 讓他想起了硅谷黃金時代的 「old silicon valley」——No secrets, just sheer execution speed。 (沒有秘密,只有純粹的執行速度)。這話我不知道算不算純粹的褒義,但團隊以此為榮,打印出來掛在公司。
09
Agent 會徹底重塑傳統 SaaS
Founder Park:在日本、歐美等出海市場,按勞動力付費(Role-based)或按 Token/結果付費(Usage-based),對于中國創業者是可行的方向嗎?
靖亞資本何沛:在 SaaS 時代,就有按人頭(By Seat)和按用量(By Usage)兩種收費模式。By Seat 適用于邊際成本極低的服務,用戶越多,成本被攤薄得越低,從而實現更高的毛利。但由于 AI 對 token 的調用成本相對過去 SaaS 對云的成本要高挺多,因此純 by seat 的模式在 AI 時代并不是最合適,一般可以采用混合模式的收費,基礎訂閱費包含一定額度的使用量,超出部分按用量付費。這可能是更為合理且靈活的選擇。在 SaaS 時代也有這樣的例子, 例如 Docusign(電子簽名服務平臺),其訂閱費用包含一定數量的固定簽約次數,超出部分則需額外購買。
Founder Park:圖片編輯產品,向上有 Canva 這樣前幾年的新銳巨頭,月活快 2 億,年收入 20 多億美元。隨著AI讓SaaS產品用戶人群無限逼近 C 端用戶,這里的機會,會不會更偏向入口級公司、大流量平臺?
明勢創投夏令:國內模型公司和互聯網大廠主要想切的還是泛 C 用戶,追求用戶基數,這符合互聯網大廠的胃口。他們也有底層模型研發能力,他們想做沒有任何問題。
但至少目前,單純靠模型很難滿足專業人士和專業領域的需求。跟模型能力限制有關,也與模型公司的發展方向有錯位。比如 GPT-4o 追求一步到位,但專對于專業人士來說,細節至關重要。比如廣告投放,細節可能對 A/B 測試的轉化率產生細微但關鍵的影響;或者在產品設計中,特定的視覺元素與要傳達的核心信息緊密相關。這與普通 C 端用戶追求「看起來不錯」或「一蹴而就」的接受標準不同。
LiblibAI 未來也一定會拓展 Agent 形態產品,核心壁壘在于服務專業人士的高質量圖片生成需求,這需要結合現有的 LoRA 參考圖生態,以及超越簡單 prompt 的多模態交互和精細控制。
審美、風格和細節是專業用戶的無止境追求,也是創業公司的機會所在。審美本質上是人類特有的能力和評價標準,模型提升的是平均審美水平,也會幫助專業人士創造更高水平的作品,而不是取代他們。LiblibAI 社區生態解決的就是專業人士對審美和風格的需求。
Atypical 邵帥:我們認為,AI Agent 正在從根本上重塑傳統 SaaS 的形態。
以往的 SaaS,本質上是將某些業務流程的「最佳實踐」進行在線化和標準化,雖然提升了效率,但降本增效的空間有限。而現在的 Agent,不再是工具型的功能模塊,而是直接切入了實際的「勞動力市場」,能夠像銷售、設計師一樣,完成具體的工作。
以我曾投資的「探跡科技」(Tungee)為例,原本是做銷售線索推薦的。如果用生成式 AI 技術對其進行重構,它完全可以變成一個真正意義上的「銷售 Agent」,用戶輸入產品信息,它就能識別潛在客戶,自動發起聯系(電話、郵件、WhatsApp)、識別客戶意圖、安排后續會談等。除了不能陪客戶喝茅臺,它幾乎能完成所有銷售流程。
Tungee
Tungee 是一個基于大數據、AI 技術的企業銷售預測智能 SaaS 平臺,用于幫助 B2B 企業挖掘潛在客戶,提高銷售轉化率及收入。Tungee 服務客戶數超 4 萬。
Tungee 背后的公司探跡科技成立于 2016 年,創始人兼 CTO 陳開冉是一名連續創業者,曾創立漢數科技。2021 年 12 月,探跡科技完成由凱輝基金領投的 3 億元人民幣 B+輪融資。
Founder Park 正在搭建「AI產品市集」社群,邀請從業者、開發人員和創業者,掃碼加群:
Coming Next...
10. AI Coding,中國創業者有什么機會?
11. AI 陪伴玩具,為什么做不對?
12. 泡泡瑪特的玩具不會說話
13. 怎么看朱嘯虎關于「具身智能」的觀點?
14. AI Infra 比云計算時代更復雜,有變化就有機會
15. 視頻生成可靈領先了,但整個行業都還在 early adopter 階段
16. 手機廠商做 AI,對創業公司來說是好事
17. 對創業者 say no 的原因是什么?
18. 未來半年,早期創業者最應該做什么?
19. PMF 的有效期變短了,M 變復雜了
20. 下一代內容平臺長什么樣?
21. Alphaist 和 Creek Stone,為什么要出來做新基金?
22. 機構當下的投資策略是什么?
23. 市場上的好項目變多了還是變少了?
24. 投資人的角色正在發生變化
25. 最近在思考哪些問題?
10
Coding,AGI 的主線
Founder Park: 關于AICoding,它似乎是通用的,中國創業者在其中的機會具體在哪里?
Creek Stone 李一豪:有幾個方面:
ToC:反而是中國最有機會的。但這點不是只有創業者在看,比如字節跳動也很關注,目標決定一切,它的目標可能是超越 Cursor,但這反而留出了服務非專業開發者的空間。當普通人掌握了 coding 能力,像 Andrej Karpathy 展示的那樣,在社區、輕社交場景下潛力非常大。我們對此非常樂觀。
ToB:企業級服務是分層的。服務超大組織、中型行業企業、小型 SMB 甚至 Freelancer 所需的 coding 產品不同,涉及安全、代碼倉、權限、交互、部署成本、Infra 等差異化需求。通用 Coding Agent 無法完全解決這些與現實資源匹配、調度的問題。這里存在很多分層機會。如果相信數字世界主要由代碼構成,這個市場足夠大,也才剛起步,又是確定性強的、有望率先實現 ASI 的方向。
Creek Stone 鐘陸歡:我們之前看到一個非官方的數據, Cursor 的中國用戶比例已超海外。不僅 ToC,ToB 也有很大機會。我們也相信我們的一些 coding 項目,憑借中國產品經理的能力,可能做出比海外產品更好用的工具,提供適合中國碼農或 B 端用戶的核心插件/組件。
Founder Park: 這是否印證了微軟CEOSatya Nadella 提出的「10 億開發者」愿景?你們說的 ToC Coding 就是開發者人群的泛化?
Creek Stone 李一豪:我認為分階段。
第一步可能是將全球 3000-5000 萬 Coder 擴展到 1 億,這會是巨大飛躍。最終的 10 億人,可能不是傳統意義的「開發者」,而是「需求表達者」,再到未來可能就成為這個世界的觀察者。
未來,當垂直 ASI 普及,甚至 AGI 出現后,大部分人可能不再直接參與生產力構建,但世界仍需有人將物理世界映射到數字世界,提出有代表性的個性化需求,更強烈地影響我們的偏好。這些人通過更高維度的方式改造世界,問出高價值的問題驅動價值生產。這些需求將通過他們自己的 AGI,調度大量 ASI,甚至走向生產制造,最終形成解決方案和產品。這是我們眼中看到的世界。
Founder Park: 你們怎么看 Cursor?
Cursor
Cursor 是一款非常熱門的 AI 編程工具,付費用戶數達 66 萬,其背后的研發商 Anysphere 在一年內實現了年經常性收入 2 億美元,是增長最快的 SaaS 公司之一。
Anysphere 于 2022 年在美國成立,由 4 名 MIT 校友成立,創始人兼 CEO 是 Michael Truell。2024 年 12 月,Cursor 完成由 Thrive Capital、A16Z、Benchmark 等領投的 1 億美元 B 輪融資。
Creek Stone 李一豪:Cursor 本質上是一個垂直 Auto-completion 的 ASI,價值巨大,活得很好,未來可能被收購或上市。它面臨的挑戰反而可能促成高價收購,比如 GitHub/VSCode 生態整合。
即使 Anthropic Claude 等平臺加入了 Coding 功能,Cursor 作為專注的 ASI 仍然有價值。企業級服務方面,現有通用模型和 Cursor 都無法完全滿足不同行業的特定需求,比如不同產業熱數據的進出,需要新公司做這樣的事,機會還是比想象中更多。關鍵是別跟巨頭做完全一樣的事。字節這樣的公司有資源和意愿做 Trae 這樣普惠性產品,這本身也創造了社會價值。
11
可愛是毛絨玩具的特點,
不是智能玩具的稀缺價值
Founder Park:如何看待AI玩具/陪伴機器人這個方向?
Alphaist 陳哲:我有投這個方向。這個方向我感覺還是特別靠產品力跟天賦的。創始人對于到底解決哪種細分的需求,解決哪一種用戶的情緒,要有很深的思考。
日本那家公司(Lovot)做得比較好的是,買了產品的人真的會持續用,有留存。這種陪伴型的產品,一定要區分是多人產品還是單人產品。我覺得 Lovot 是個典型的單人產品,需要單人環境去養成互動。那里面有非常多的一些巧思和設計想法,我覺得這個特別考驗創業者的靈性跟感覺。
Lovot
Lovot 是一款來自日本的高端 AI 陪伴玩具,售價 69 萬日元(近 3 萬人民幣),面向 40 歲到 60 歲的高收入女性群體。2025 年 1 月底,LOVOT 的出貨量超 1.5 萬臺。
Lovot 背后的公司 GROOVE X 株式會社于 2015 年在日本成立,創始人林要曾在豐田汽車、軟銀工作,在軟銀工作期間,林要參與了機器人「Pepper」項目。
要說這個品類的標桿,我覺得還是回到迪士尼做的那些東西,像 Wall-E,像 GTC 展示的那個兩足小機器人。他們在表情、情緒、運動、機械設計、ID 設計、動畫設計方面都非常好。不是一群工程師設計出來的,是美術師、插畫師跟工程師聯合做出來的。有沒有 IP,有沒有做形象、做故事的能力,對于這種產品是非常關鍵的。 而這個能力我認為絕大部分投資人是比較忽視去如何 assess 的。
我尤其覺得,切忌把產品做得非常 fluffy(毛絨的)。大家對 fluffy 的東西 initially 都有親近感,這是本能。但這跟兩性荷爾蒙反應一樣,沒有持續互動的 drive,看久了就沒感覺了。
Fluffy 是一個非常危險的捷徑,不能因為毛絨的正反饋就疏漏了更難的部分。你看迪士尼做的產品,不需要 fluffy,甚至不用說話(Wall-E),靠表情、動作就能構筑角色人設和情感連接。這種產品最難的是怎么做到持續留存,怎么讓用戶覺得你是有 personality 的。強調「萌」「可愛」是所有毛絨玩具都有的,不是智能玩具的稀缺價值。
12
讓玩具開口說話,
破壞了「沉默」帶來的想象空間
Atypical 邵帥:從消費品,尤其是玩具本身的角度來看,讓玩具開口說話功能可能違背了直覺。比如,大家購買泡泡瑪特的 LABUBU 或 Molly 這些玩偶,恰恰是因為它們的「沉默」創造了巨大的想象空間。如果強行讓這些玩具開始說話,反而可能破壞這種想象力。
再比如,歐洲的 Tonies 玩具系統,它的設計非常簡單:一個底座,放上不同的玩偶,就能播放對應的音頻故事或音樂。沒有復雜的 AI 對話功能,但它每年依然能取得數十億人民幣的收入。
Toniebox
Toniebox 是一款為 3-8 歲兒童設計的音頻播放器,核心亮點是「無屏幕」和「實物互動」。Toniebox 是全球兒童音頻播放器的銷量冠軍,截至 2024 年 9 月,Toniebox 總銷量 780 萬臺。
Toniebox 的母公司 Tonies 于 2013 年在德國創立,創始人 Marcus Stahl 曾任諾基亞運營總經理。
有時候,越簡單的產品反而越好?!缸鰷p法」或許更為明智。如果 AI 玩具僅僅是追求對話功能,那未免太過單一。畢竟,小朋友在沒有明確「上下文」的情況下,往往不知道如何與玩具進行有效互動,且這樣的互動和天貓精靈沒有太大差別。如果玩具本身沒有 IP 價值,為何要購買?
我們都期待像《玩具總動員》那樣的場景成真,玩具能像電影中的角色一樣,具有豐富的情感和智能。但這種理想中的產品形式,到底應當是什么樣子,仍然值得進一步觀察。
Founder Park:目前大多數AI玩具的「核心」依然是讓玩具說話,但這種方式可能并非創業公司的真正競爭優勢?
Atypical 邵帥:對,尤其是針對智能玩具,核心應該回歸到用戶的真實需求。如果只是簡單的問答,智能音箱已經足夠滿足需求了。
如果用戶是為了獲得情感價值或「娛樂性」,那么創業公司更應專注于創造獨特且有趣的玩法(Play Pattern)。
回顧以往成功的玩具或產品 IP 之所以能成功,很大一部分原因就在于創造了獨特的玩法和品類。例如,盲盒的玩法基于「開箱驚喜」,積木的玩法體現在拼搭過程的樂趣。對于智能玩具來說,關鍵需要考慮的幾個問題在于,你能為用戶提供什么獨特的玩法?這個玩法是否能夠構成核心價值?它是否與玩具的品類定位、IP 價值等緊密相關?這些考量比單純的讓玩具能夠開口說話要重要得多。
Founder Park:但 IP 對初創公司來說確實是一大挑戰。
Atypical 邵帥:是的,IP 在玩具領域確實是一個極其重要的戰略控制點??梢哉f,「得 IP 者得天下」。如果初創公司僅僅依靠引入成熟的 IP,實際上是在為像迪士尼、萬代這樣的巨頭打工。
我的建議是,盡量創造自己獨特的 IP 和玩法。比如 CES 上 Robopoet 公司推出的 AI 萌寵機器人「Fuzzoo」,它將五行(金木水火土)做成了五個毛絨形象,具備輕度的智能互動(例如摸摸它,眼睛會動)。它的「開口說話」能力,必須通過用戶完成一些任務(比如喂食、撫摸)來逐步解鎖。Robopoet 很像過去的電子寵物(拓麻歌子)。
Fuzzoo
Fuzzoo 是一款 AI 毛絨寵物,搭載了多模態情感模型,主打陪伴、傾聽等情感陪伴功能。Fuzzoo 在 MWC 2025 和 CES2025 上的展示引起了諸多關注,目前尚未對外開售。
Fuzzoo 背后的研發商 Robopoet(珞博智能)成立于 2024 年。Robopoet 創始人孫兆治曾在小鵬機器人工作。Robopoet 于 2024 年年中完成了千萬元的天使輪融資。
Robopoet 在嘗試打造自己的 IP 和品類,雖然是否能成功尚未可知,因為創造成功的 IP 并不容易,但這個路徑是值得我們探索的。如果它成功驗證了這一模式,再去做那些「錦上添花」的事情,比如利用成熟的 IP(如寶可夢)將其智能化,可能會更加可行。
13
被高估的和被低估的,
都是具身智能
Founder Park:具身智能最近討論很熱,甚至有些過熱。怎么看這個領域?
創新工場任博冰:(關于某些外部評論)我覺得有些判斷過于從基金而非賽道或項目角度出發,沒親自聊過項目,對人的判斷就無從談起。
從賽道角度看,我們認為具身智能還非常非常早期,大概相當于 NLP 的 GPT-1.5 到 2.0 階段。我們最近在看很多相關的 Paper 和項目。上一代具身智能我們投得不多,也在復盤,覺得有些過于謹慎了。第一代公司做了很多有價值的探索,但第二代、第三代仍然有大量新機會。我們既然錯過了第一波的部分機會,就會更關注第二波、第三波。
錦秋基金臧天宇:我們覺得這個領域很矛盾:一方面,確實存在短期過熱;另一方面,它帶來的長期變革可能也是被低估的。
我們認為具身智能的發展速度可能會比預期快,一年半左右就能看到模型上顯著的進展,陸續可以看到在一些 2B2C 商用場景的落地。
但短期的噪音確實很大,很多資金涌入,大廠紛紛入局,但不一定都投向了真正能推動事情發展的方向。這種過熱甚至可能打亂一些優秀團隊的節奏,比如一些本來可以打磨產品的團隊,可能因為融資競爭壓力而不得不提前啟動融資,反而拖慢了研發進度。
盡管如此,我們對具身智能的中長期潛力非常樂觀,會持續投入,關鍵是要屏蔽掉噪音。
14
MaaS 面臨云廠商的競爭,
創業公司怎么辦?
Founder Park:前段時間潞城和硅基流動的爭論引人關注,工場同時投資了兩家的機構。當時你們怎么想?后來做了什么?現在對AIInfra 領域是否有新的思考?
創新工場任博冰:(笑)是的,除了我們還有華為。我是兩家公司的董事,我們至今仍是第一大股東。個人覺得,爭吵沒有必要,對雙方業務都沒帶來實際價值,反而消耗了精力。我們后來找了專家出了方案,幫助他們化解了矛盾。
兩家公司現在業務增長都非??欤荚诟髯再惖郎嫌泻芏嗍虑橐觯医衲甓济媾R很好的窗口期。我們建議創始人把精力聚焦在主營業務上。
關于 Infra,現在的定義比以前(如云計算時代)復雜得多。
工具鏈復雜:模型算一層,但模型與 Agent 工具是耦合還是解耦?MaaS 公司是否要做 Agent 相關的事?微調工具是不是簡單調個 API 就行?這些都不確定。ToB、ToC、to Agent 的應用形態都不確定,這對推理、微調、訓練生態都有很大影響。
云的潛在變化:未來的應用可能不都掛在云上。也許操作系統定義會變,所有窗口都是瀏覽器,不再需要裝那么多本地應用,應用變成中間件。這會對應用、云、Infra 公司都產生巨大影響。
只要有變化就有機會。沒有變化才尷尬。變化中最快響應的通常是創業公司。
Founder Park:我們的調研發現,硅基流動最初的確有大量的企業和開發者在接入 DeepSeek,但云廠商也在跟,火山等云廠商動作很快,有很多人最初選擇硅基流動,最終還是用火山接了。對 MaaS 創業公司來說,壁壘存在問題嗎?
創新工場任博冰:我個人覺得,不要太高估云廠商的研發能力和內部協同效率。比如華為的卡適配 DeepSeek,很長一段時間內,甚至未來半年,可能都只有硅基流動能做得比較好。為什么會這樣?理論上創業公司不該領先這么久,但事實就是如此。
云廠商內部本身就存在算力部門、云業務部門等的競合關系。算力團隊可能想和硅基合作,云業務團隊又視其為對手。這種混亂的生態反而對靈活的 Infra 創業公司有利。
創業公司可以在這種競合中獲得資源和流量。像 DeepSeek 帶來的流量,早期硅基流動可能接不過來,但每次多接一點,公司就成長一點。畢竟公司才成立一年多。類似的流量會持續有。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.