Lovart 值得關注,它是 AI 應用層團隊產品創新能力的印證和延續,這是 Manus 之后最火的 Agent,從通用領域,成功地向垂直賽道落地了 Agent 產品形態。
據了解,Lovart 發布后,推特上出現近 5000 條討論帖,官方視頻播放近百萬,獲得馬斯克點贊、Grok 官方發帖討論。24 小時內,waitlist 申請人數超過 2 萬。
(一個使用 Lovart 制作的 Lovart 宣傳片)
基礎形態上,Lovart 看起來與 Manus 很像,一個能夠調用工具的 Agent,替用戶完成任務。
但 Lovart 在垂直領域更進一步,它把一種需要多模態的「職業」變成了工作流再內化成 Agent,配以適合設計師使用的產品形態——畫布。「畫布」就是「桌子」,還原到設計的原始狀態,沒有電腦,只有筆和紙,一個人有需求,一個人有能力,好的設計作品在這個場景中誕生。
「Lovart 現在當然是一個工具,但以后呢?它會是一個有職業屬性的人,直接交付服務的結果。」
Lovart 創始人 & CEO 陳冕在 AI 設計領域有很多實踐經驗,他認為圖像生成的 AI 產品,其實已經走到了第三個階段。
1.0 階段,Midjourney 等產品,圖片生成的單點能力直接產品化; 2.0 階段,ComfyUI 等工作流產品,點連成線,多種模型能力的鏈接,AI 能做到更多圖片創意的任務; 3.0 階段,Agent,如 Lovart,讓 AI 參與工作流的規劃和執行,進一步降低用戶門檻。
創作工具正在不斷簡化,ComfyUI 的高門檻拒絕了很多創作者,但 Lovart,至少這是第一款讓我們的專業設計師在看到之后想要第一時間嘗試的產品。
在 Lovart 發布后一天,我們與陳冕做了一次對話,Lovart 是如何誕生的?它背后有著怎樣的思考?在這篇訪談里都可以找到答案。
創始人信息:陳冕,本科畢業于東南大學,曾任職于摩拜擔任產品總監,曾是字節跳動剪映、CapCut 全球商業化負責人。
采訪 | Nico
編輯 | Nico、夏天
Founder Park 正在搭建「AI 產品市集」社群,邀請從業者、開發人員和創業者,掃碼加群:
01
AI 圖像產品的三個階段
Founder Park:Lovart 是一款受到 Manus 啟發的產品嗎?
陳冕:我很感謝 Manus。創業圈子里,很多前沿的公司,大家的認知其實是相似的。但在一件事情沒有發生的時候,你雖然有認知,但將信將疑,不是百分百的篤定。直到一件事火了之后,才能形成群體共識。
群體共識會加重你對這個認知的篤定程度。我們在 Manus 發布前就在做 Lovart,不然也不可能在當下非常快速的做出來。坦白講,讓我們激進地去準備、覺得方向確定的時刻,還是在 Manus 火了之后。
但是最終,潛意識釋放出來后火了,其實是被大家共識了,是時代在呼喚這個產品。那個時候我們也非常興奮,那就證明 something right。
創新就是這樣,大家最開始其實都是在長夜里憑著自己的認知一點點往前走,但是是將信將疑的,但隨著越來越多的產品出來,這個信念會變得越來越篤定,這條路也會變得越來越共識。所以,真的還是挺感謝他們。
Founder Park:Lovart 是一款 for everyone 的產品,還是一個 for designer 的產品?
陳冕:我們做的是一個垂類 Agent,不是通用 Agent。大公司有強大的技術和流量優勢,不想陷入對抗性競爭,要走創新的產品競爭,通用 Agent 當然是 for everyone 的,大公司會更傾向于 for everyone,因為這顯然是更大的機會,但對創業者而言,挑戰非常大。
張一鳴之前提到,創業進程里,認知最重要。我感同身受,現在 AI 創業就是「認知領先 + 極致執行」,就是拼命執行,非常迅速地執行是最重要的。誰能做出第一個創新的產品,這對創新公司來說是很重要的。
Founder Park:Lovart 這款產品是如何做出來的?為什么想做這樣一款產品?
陳冕:從我們的經驗來說,設計、圖像生成這類的產品(甚至也可以遷移到 LLM 產品)存在三個發展階段。
1.0 階段:內容生成,即單一的內容生成。最開始大家使用的是 Midjourney、Stable Diffusion,國內有 Liblib。這是最開始的第一波浪潮,那時大家使用 Liblib 是通過 WebUI,本質上還是在進行生成,這是第一個時代,我們稱之為 1.0 時代。
2.0 階段:工作流。Coze、Dify,以及許多其他產品,實際上都在構建工作流。圖像領域也是如此,很快,您會發現大家開始使用 ComfyUI,更復雜的工作流則通過 ComfyUI 來實現。這里存在一個巨大的變化,在圖像這個領域,WebUI 和 ComfyUI,尤其是在中國,這兩款產品實際上是應用范式變化最有代表性的例子。它背后代表的變化是,AI 最終目的是幫助人完成一連串的工作。因此,這項工作的第一步,或者說原子單元,是一個一個的生成能力,或者說生成工具,亦或是傳統工具。最開始是這種生成能力被創造出來,所以大家可以將生成能力作為其工作流程中的一個工具來使用,把這些工具串起來做成一個工作流,就能取代原有工作里更大比例的任務了
3.0 階段:Agent,我們將 Agent 定義為由 AI 規劃并執行工作流。因為(Claude 等)模型能力提升,AI 就可以串聯所有的工具和工作,并執行出來。人只需要向 AI 發指令了。
這個認知并非我們最初做 AI 創業時就有的,這是對整個 AI 應用的通用認知。一開始大家只做 AI 生成(比如圖片、視頻),后來出現工作流形態,這背后是因為每一個引領時代的產品都做對了某件重要的事情。
Founder Park:3.0 的產品,比如 Lovart 和 Manus,現階段用戶價值還沒有閉環,為什么要選擇一個還不成熟的產品形態?
陳冕:Lovart 這個產品也是基于我們的一些認知與判斷,當然現在也有很多人覺得 Agent 并沒有那么成熟,坦誠講,Agent 確實沒有那么成熟。但如果等 Agent 真的成熟了,那就不是創業者的機會了,尤其不是應用創業者的機會了,因為應用創業者本身并不掌握模型。在應用層創業,認知領先非常重要,在模型沒有那么成熟之前,就應該想到未來的方向。
當群體的潛意識被共識了,這是件很有意義且有成就感的事情。這也是我覺得應用創業者就應該這么去做的事情,因為當你不掌握模型,也不掌握流量時,最大的創新就來自于認知。
Founder Park:最近有一個觀點,對AI創業者來說,現在出來和兩年前出來是一樣的,因為產品形態發生了顛覆,之前的積累可能沒什么價值。
陳冕:我不認同。在我看來,認知是累加的。沒有經歷 1.0、2.0、3.0 時代,無法如此順暢地想到這個過程。Manus 也是一樣的,Monica 就是它的 1.0 時代。所以這個認知是在大家的摸索當中,隨著技術趨勢的明朗、技術路徑的共識、技術能力的成熟,大家逐漸形成的共識。
02
還原設計最原始的樣子
Founder Park: 在 1.0、2.0、3.0 階段,你們是如何積累有價值的經驗?對業務和產品有什么幫助?
陳冕:針對設計這個垂直領域,我們在思考一件事:AI 時代的交互范式或方式應該是什么樣?大家有很多討論,比如 Language UI、是否需要 GUI 等等,討論非常多。在這方面,我們也有一個關鍵判斷,交互在不同的垂直領域和場景下,應該有所區別。
舉個簡單例子,我們現在面對面訪談,互相對話是個場景,有其對應的交互方式。在跟設計師聊設計,光說話可能不夠,得有人在設計屏幕前指指點點,經典甲方場景。所以我們想,如果 AI 成為「人」,終局交互不能只靠對話,這是我們創業第一天就想明白的。不同垂直場景,需要不同界面和交互。設計這種視覺傳達、視覺對齊很重要,所以需要屏幕和手勢完成和視覺的對齊。
在 Lovart 產品里的體現成「畫布」。Lovart 左邊畫布,右邊對話框,就像設計跟老板/甲方對話時,旁邊就是屏幕,鼠標是老板的手。基于這個點,我們思考我們應該做什么?是不是應該早點做畫布?所以我們在畫布能力和工具方面做得比較早,也花了不少力氣。
畫布本質上可以說是屏幕,但拋開屏幕,本質上如果現在我們把所有科技的東西都去掉,如果人類回歸到筆墨紙硯,畫布就是桌子。現在我們兩個人在做設計,甲方站在你旁邊告訴你要做什么,你把作品放到桌子上,ta 對著桌子指指點點。所以桌子上不應該是 ComfyUI 或者之前的一些工作流產品。
桌子上是作品,能夠拖拽指點,這是最原生的交互方式或者界面。雖然工作流產品看著像在 canvas 上,但實際不一樣。我們的 canvas 本質是桌子,盛放作品,最自然的交互就是指著作品說修改。這是我們垂直領域最初認知,所以我們才更早積累畫布能力和 Edit。
(來自 Founder Park 同事的實際體驗)
Founder Park: 還原設計這件事最原始的樣子,這是一個很有意思的思考,但它如何通向「有用」的AI產品?
陳冕:回到你前邊問的問題,我們為什么不 for everyone?
去想最原始的樣子,人在桌子上做三件事:涂抹、裁切、拼貼。AI 誕生后,像旁邊多了個甲方(用戶)指揮 AI。理想情況是甲方指揮 AI 完成所有任務,這時才能 for everyone。但這需要模型能力很強。如果不夠強,就會出現用戶說「你做不好,我自己來」的中間狀態。
所以你會發現,桌子(畫布)需要在,桌子旁的傳統工具箱(Edit)也要在。因為用戶有時發現 AI 做不好,就會推開說「我來」。所以現在本質是 Agent + 桌子 + Edit。桌子放 AI 產物、支持修改,也承載傳統 Edit 能力,那能力在桌子旁的工具箱。旁邊多出的那個人就是對話框。所以對話框、桌子、工具箱,這是合理且一直存在的形態,也是我們想做的。
那設計何時能 for everyone?當模型智能強大到不再需要那個工具箱,用戶通過對話、指點就能完全滿意,不會自己上手時,就可以 for everyone 了。
但 Edit 能力是面向專業消費者的,普通人用不了工具箱。所以工具箱還在,設計師就會還在。當工具箱不需要了,沒有用戶自己上手的瞬間,設計師可能會失業。但設計師的核心價值——創意、對人類共鳴的洞察,AI 目前無法取代。
AGI 也許能取代,但這對社會的沖擊會很大。至少現在,我認為 AI 只能模擬理解感受,無法真正洞察人類共鳴的情況,所以藝術家/設計師的意義就在此。產品能 for everyone 是未來的事,這是我們現在的認知。所以我們現在不想做一個 for everyone 的產品,而是做 for Prosumer 的產品。我們希望成為設計師的朋友,因為我們認為最終設計師的本源是創意,在于對人類潛意識里對共鳴的渴望的洞察,這是他們不可替代的價值。所以我們做的其他事情,是希望能讓他們 focus 在創意之上,把其他瑣事交給 AI,給他們插上翅膀。我認為這是 AI 在現階段的意義。
Founder Park:圖像領域一直有一個藝術相關的問題,比如更好更高效的AI工具,是否在加速前沿藝術風格成為大眾審美的這個進程?比如很經典的,梵高的作品直到他過世后才受到認可。
陳冕:我覺得這不一定會發生。一個藝術風格,藝術家常常在其身后才被廣泛推崇,有時是因為他們對群體感受和潛意識的洞察過于超前,這需要整個社會周期性的變化才能跟上。這種變化是深層的,與社會發展密切相關,我認為不會因一個工具的出現而根本改變。我們現在做的,是把工具還原到它應有的形態。
在不同的時代,工具形態是不同的。在紙媒時代,沒有電腦,桌面擺滿了手稿,這是當時的「桌子」。在電腦時代,設計師親自動手,Photoshop 帶著畫布和各種工具出現,那就像當年的桌子。而現在,當人越來越成為甲方,AI 成為乙方時,這個「桌子」應該是什么樣子?這是我們非常感興趣,也是我們從 day one 就在思考的問題。Lovart 是我們目前給出的答案。
03
Lovart 會成為一支「創意團隊」
Founder Park: 現階段這款產品,您提到它并非百分之百完美,它欠缺哪些方面?
陳冕:欠缺的地方很多。
Agent 的能力不夠強,我們期待基礎模型能更強大,這樣我們的產品也會更厲害。我們需要 leverage base model,而不是被其取代,這是很重要的思考。你的核心價值應該在基礎模型之外,才能真正利用它。如果你的工作只是為基礎模型現階段的不成熟打補丁,那不是利用,是在對抗,這樣做是「找死」。
當然,產品自身也存在許多 bug。最近因為關注度高,很多人反饋邀請碼問題,這確實是我們的不足。核心原因有兩個:首先,我們采取的是小范圍用戶先行體驗、收集 bug、迭代后再開放下一批的策略。在 bug 修復完成前,不宜大規模開放,這是最主要的原因。
其次,坦白說,我們也不可能無限量地發放邀請碼。很多用戶也能理解,這涉及較高的成本。目前我們的邀請碼是純免費使用,確保用戶體驗,但這背后是有運營成本的。好在圖像領域,token 成本問題相對其他領域還沒那么嚴重。所以我們目前的成本并不是非常高,但確實也不低。我們非常有信心能盡快實現公開使用。
開發 Agent 的過程非常有趣,AI 真的有自己的「想法」。正如 Manus 主張的「less structure, more intelligence」,我們非常認同這一點。因為在與 Agent 調試時,你不能把指令說得過于死板,那樣反而會限制其智能。這和人一樣,只告訴它按步驟 ABCD 執行,它反而可能變笨。你需要告訴它目標是什么,它在中間過程會展現自己的思考。比如,我們有時會告訴它,用某個基礎模型的圖像工具換臉效果不好,應該改用我們內部專門用于真人 face ID 的工具。但有時它并不這么認為,它會有自己的判斷。
Founder Park:你會把 Lovart 定義為工具嗎?
陳冕:當然,它首先是一個工具。但你可以理解為,它現在是工具,未來可能演變成一種「人」、一種「職業」,或一種服務。這也是 AI 帶來的變化。一個非常有意思的商業命題是:我們不能沿用工具時代的思路來理解 AI 時代的工具。SaaS 的本質是服務由人提供,是人使用工具。而現在,AI 成為提供服務的主體。這里的商業價值巨大,本質上是對特定職業生產效率的提升甚至替代,是對生產關系的重構。所以這是一件令人振奮且意義巨大的事。盡管國內投資人過去在工具類項目上損失慘重,但我認為對 AI 領域的投資應更樂觀。
Founder Park:未來產品能力和功能會有哪些預期內的更新?
陳冕:我們還有很多想要實現的功能,坦誠講,目前上線的功能只是一部分。大家能想到的許多功能未來都會有。比如當天晚上已經接入了 3D 的展示。現在用戶可以一句話生成視頻,甚至配上音樂和配音。未來,用戶可能只需一句話就能設計一個 3D 模型手辦,我們正在開發這個功能,很快就會上線。這些都是我們希望在正式發布前完成的功能,所以我們還在整合更多能力。
Founder Park: Lovart 有圖片、視頻,以后還會有 3D 和音頻,它最終會變成什么?
陳冕:它會是一個融合了設計師、導演、攝影師角色的存在。很難用單一職業概括,你可以把它當作一個未來的「創意團隊」,設計團隊或創作團隊。這個團隊內部有 Multi-agent 協作完成任務。這件事情的本質上解決的是 creation,所以它是一個 Creator team。
Founder Park: 設計師、導演和攝影師,為什么不是三個獨立的產品?
陳冕:用戶作為甲方,需要的是整合的服務。從這個角度看,這款產品也可以被視為一家「設計公司」。
有了這些不同的能力(工具/Agents)之后,還需要一個「領導者」,對吧?負責調度的就是領導者,最聰明的模型需要負責調度這些工具,它必須知道每個模型、每個 Agent 的能力邊界。最終人扮演的就是甲方角色。最終,人是甲方,提供最關鍵的創意。甲方依然非常重要,需要滿足人的需求。所以從這個角度看,盡管它提供服務,但也可以被稱作一種工具,因為它最終還是為了滿足人的需求而出現的。
當然,如果未來 AI 真正有了自主意識,自主創造,那太 crazy 了,等 AGI 實現了再說。我們本質上做的還是我們覺得在前 AGI 時代該作為一個工具,或者作為一種服務,作為一種新的職業,它應該具備什么形態和功能。
Founder Park:過去所有主流的圖片產品(如 Canva、PS)、視頻產品(如 PR、剪映)以及音樂產品,都是相對獨立的,并且通常針對不同人群收費。您怎么看?
陳冕:其實它們都不是完全獨立的。Adobe 有圖片、視頻、音頻產品;Canva 也有圖片和視頻;剪映有視頻,其姊妹產品「醒圖」針對圖片方向。你會發現任何一家公司基本都會覆蓋圖片、視頻,甚至音頻領域,只是切入點不同。
它們確實不是同一個產品,我理解你說它們分開,是因為用戶在不同場景下使用。但你想,人類在創作過程中是需要在不同產品間切換的,先用修圖軟件處理圖片,再導入視頻編輯軟件,可能還需要其他軟件處理音頻。現在,這項切換和整合的工作由 AI 來做,但背后仍然調用了許多工具。比如在 Lovart 中,AI 會調用 Kling、GPT image、ElevenLabs 等底層工具。工具層面是獨立的,但使用者是 AI,它在一個統一界面下完成。最終人是甲方,需要的是一個整合了這些工具成果的作品。所以我們認為,在創意領域,必然會涉及各個模態和品類。
關鍵在于,這款產品最終是否融合成一個整體,要看用戶最直接接觸的界面是什么樣的。如果用戶仍然需要手動在各個工具間切換,那就是分離的產品。但現在,這個負責「切換和調度」的角色由 AI 擔任,用戶只需與這個 AI 交互。這個 AI 在后臺調用各種工具,那么產品形態自然會是統一整合的。
Founder Park: 核心是交互方式改變了。以前是人直接操作工具,需要切換,現在是人與會用工具的AI協作。
陳冕:對,但是你現在面對的是 AI,而 AI 面對的是多個工具,這是不同的。你可以因此獲得一個團隊、一家公司,比如一家設計公司。所以 AI 的可怕之處在于,它從最初取代工具,到可能取代個體職業,最終取代的是具備協作能力的團隊,這才是最 crazy 的。
Founder Park: 過去一些產品未能完全融合,部分原因可能在于其多采用訂閱制的商業模式。
陳冕:Canva 在融合方面做得很好,一個會員賬戶可以通用整個產品線。我認為 Canva 已經相當融合了。Canva 有視頻功能,而且有很多視頻模板。比如我們為 Canva 付費,可能是為了制作海報或公眾號配圖,只需為此付費,它也能支持團隊協作,每月也就幾十塊錢。回到 Lovart,產品未來肯定會商業化,一定會用訂閱制的方式。當前 Lovart 主要面向的是海外市場。
Founder Park:針對商業模式,國內用戶更傾向于免費產品,你怎么看訂閱模式不會是中國AI主流商業模式的觀點?
陳冕:我不認同這個觀點。中國人愿意為服務付費,為最終結果付費,只是對純粹的工具付費意愿較低。所以關鍵在于 AI 最終是工具、服務還是結果?這取決于模型的智能程度。我們認為 AI 最終會成為直接交付結果的服務,因此中國用戶會為此付費。這是對未來的預判,當下我們先從海外市場開始。
Founder Park:Lovart 目前還沒上線付費功能,未來會推出嗎?
陳冕:是的,我們現在可以說是字面意義上的「在燃燒」資金。我們虧不起。
Founder Park:大概什么時候會上線付費?
陳冕:應該會在幾周內。(笑)主要等 Bug 修復得差不多了就會上線。
Founder Park:Lovart 上線后,會有一個核心的「北極星指標」嗎?比如用戶粘性、數量、留存率等,您最看重哪些?
陳冕:我想這方面的衡量標準大家是趨同的,最核心的還是用戶是否愿意為產品付費,以及付費后的留存率。
04
我們團隊沒有產品經理,
只有設計師
Founder Park: Lovart 最核心的是理解用戶意圖,并將其拆解轉化為AI的執行流程。在使用 AI 和大模型完成這件事的過程中,有什么經驗或感悟嗎?這對于公司而言是全新的探索,因為之前的業務似乎沒有太直接相關的經驗。
陳冕:對公司來說,這當然是全新的體驗,因為我們之前沒有 Agent 產品。如何與 Agent 協作和打交道,我們也是第一次。它們確實有自己的「想法」。所以在這方面,我們都還在持續摸索。不過,我們公司有很多設計師,他們覺得這個過程很有意思,因為某種程度上他們在「教」AI 如何進行設計。
本質上就是將人類的設計 know-how 傳達給 AI。我們團隊里不少同事有美術或設計教育背景,他們以前教學生,現在教 AI。AI 的「智商」不低,但有時又難以完全掌控,我們開玩笑稱 AI 為「小朋友」。這就是目前的工作狀態。這里可以簡單理解為將設計領域的知識和流程融入到模型訓練和 Agent 邏輯中。
這個過程很有意思。我是產品經理出身,但我認為,未來的通用型產品經理沒什么用。我自己也有十多年的產品經驗,經歷了移動互聯網的完整周期。我認為未來的產品經理,其核心價值更多在于行業知識深度,在于將特定行業的 Know-how 體系化地教給AI。因此,產品經理的角色將更加分行業、分垂直領域。我覺得通用互聯網產品經理是個很危險的職業。
Founder Park: 為什么說產品經理很危險?
陳冕:通用型的 Agent 未來被基礎模型內化的可能性很高。我認為未來真正能實現百花齊放的,是專注于垂直應用的那些 Agent。這些垂直 Agent 的核心競爭力在于其背后蘊含的垂直領域專業知識。對于上一個時代的通用互聯網產品經理,我確實覺得其定位有些模糊了。
Founder Park: 從職業發展角度看,它可能會演變成一種高度專業化的角色。
陳冕:對,如果通用能力被模型底層吸收,只需要最強的那幾個人就夠了。
Founder Park: Lovart 現在對相關職位的稱呼已經不是「產品經理」了嗎?
陳冕:在我們團隊,產品經理沒什么用。
當工具足夠智能,「管理需求的人」不再被需要,但「定義需求的人」反而更重要。把產品交互設計成「畫布」,本質上是在回答一個問題:AI 和人類如何共享同一張桌子?
答案很明確——AI 坐在執行端,人類坐在創意端。產品經理曾經是兩者的橋梁,但現在,AI 直接聽懂了設計師的語言。所以我們團隊沒有產品經理,只有「教 AI 的人」。
Founder Park:這聽起來有點悲觀,仿佛我們在讓設計師們把他們的行業經驗教給 Agent,而這些 Agent 最終可能取代設計師。
陳冕:不,我們始終強調我們是設計師的「朋友」,你剛剛講的「取代」是無法對抗的,關鍵在于如何看待它。AI 確實極大地解放了生產力,同時也可能讓頂尖設計師的思維模式變得更平權。換個角度看,以前的頂尖設計思維,只有找頂尖設計師才能獲得,服務很貴。現在,這種高質量的設計可能變得「For everyone」,而且成本大幅降低。問題在于成本降低后,那些依賴原有模式生存的人怎么辦?這確實會引發生產關系的調整。但這屬于社會層面的問題,交給時代去解決吧。
Founder Park:對于設計師和產品經理這兩類人才,我們在公司更看重哪些特質或畫像?傾向于招聘什么樣的人?
陳冕:在我們公司,我覺得產品經理沒什么用,設計師才有用。這是基于我們專注于設計這一垂直領域而言的。我們所有的產品迭代和案例積累都圍繞著設計師的工作流和需求進行。
Founder Park: 兩種人,一種具有深厚設計功底的產品經理,另一種原本是設計師但轉而承擔產品經理職能、之前沒有典型產品經理經驗的人,更傾向于哪種?
陳冕:傾向于后者,原本是設計師,后來在公司內探索并承擔部分產品定義職責的人。
05
為什么有數據的 GitHub,
代碼工具不如 Cursor?
Founder Park:您剛才提到產品能力的提升依賴基礎模型,比如 GPT-4o 的圖像能力。GPT-4o 的圖像API發布對 Lovart 有很大影響嗎?如果沒有 4o 的圖像能力,Lovart 這樣的產品是否就無法存在?
陳冕:Agent 的核心能力取決于模型對工具的調用和規劃能力。Agent 的能力才是本質。即使沒有 4o image,Agent 也能存在,只是效果可能會打折扣。
因為很多語義理解、圖像內容一致性等問題,確實需要依賴更好的圖像模型來解決。所以可以理解為,GPT-4o 在圖像模型能力上帶來了顯著提升,但它并非 Agent 能力本身。我們同樣也期待 Claude 4 以及國內如 Qwen 等模型的進一步迭代。我們也希望能有非常好用的國產 Agent 能力。
Founder Park: 兩年前大家熱議Midjourney,最近卻沒什么聲音了,你怎么看?
陳冕:這是產品從 1.0 向 2.0、3.0 的演變。Midjourney在語義理解和解決部分工作流問題上表現出色,但它仍然是 1.0 產品。現在市場已經進入 3.0 階段了。
至于 Midjourney 團隊,我感覺他們可能志不在此。
Founder Park:社區型產品其實比工具型產品有更強的用戶粘性,所以剪映、WPS 會有模板創作社區,Lovart 這樣的產品會有類似的形態嗎?
陳冕:不,我認為工具和服務的用戶粘性是非常強的。如果一個工具粘性不強,那只能說明它不好用,或者使用成本太高,時機未成熟。工具的粘性非常強,它不是針對所有人的高頻消費品,但專業人士會頻繁使用。就像剛提到 Canva,做營銷的人群中其使用比例很高。不求天天用,但求有需求時能用且好用,我覺得這就足夠了。所以用戶是否持續使用,本質還是取決于使用成本、體驗和能否切實解決問題。這不是靠社區能夠解決的問題,這樣做是 make sense 的。
要做社區,就專注做好社區。要做工具和服務,就專注做好工具和服務。如果工具或服務沒有用戶留存,那只能證明工具或服務本身沒做好,而不是其他原因,除非服務本身的使用頻率就極低。但我們做的不是這類,我們不做普通用戶,是因為普通用戶的創作需求通常非常低頻,比如僅僅是為了社交分享,他們在微信、抖音等平臺使用內置 AI 功能即可,沒必要使用我們的產品。我們選擇做垂直領域,所以,雖然剛才討論了通用與垂直,但我們實際上已經選擇了垂直領域。坦白講,做通用產品我們也競爭不過大公司。
Founder Park:工作流數據能帶來更好產品體驗嗎?比如 GitHub 擁有大量代碼數據,也在做工具,但似乎在與 Cursor 等競品競爭中并未完全體現數據優勢。您覺得 Lovart 從 1.0/2.0 時期積累的數據優勢體現在哪里?
陳冕:我覺得 Cursor 才具備數據優勢,因為 GitHub 的代碼能力大部分已經被 Claude 等底層模型內化了。GitHub 基于自身數據做工具就沒有絕對優勢。代碼能力被底座模型吸收了,代碼數據就不再是獨有優勢。而 1.0 和 2.0 的數據之所以有意義,在于它們記錄了用戶如何運用 AI 工具、如何結合 AI 與傳統方法進行創作,這是非常有價值的。ComfyUI 的工作流本質上是將各種模型和傳統功能模塊堆砌起來。
這些工作流數據是 AI 需要學習的,而底模在這方面是空白的。對于 Cursor 來說,知道哪些代碼應該用 AI 寫,哪些應該手動寫,這部分知識很重要,但后來者可能難以準確獲取。這就是區別所在。
Founder Park:你們會考慮自己開發模型嗎?這是很多 Agent 公司都會面臨的問題。
陳冕:現在不會。這取決于如何定義「做模型」,是完全從預訓練開始,還是強化微調。目前我們不會做完整的模型開發。
Founder Park:您認為現階段的 Agent 產品,是否需要將 workflow 等用戶行為數據用于訓練模型?
陳冕:是的,可能需要通過 SFT 或更進一步的強化學習來進行訓練。RL 是必須做的。
Founder Park:考慮到設計領域有很多團隊在探索,我們會思考,面對這些競爭,我們的核心差異化優勢在哪里?
陳冕:差異化不是看了市場上有哪些產品、發現別人沒做什么才去做的,那樣反應就太慢了。真正需要思考的是,你自身的優勢是什么?在規劃要做的事情時,要想清楚這需要哪些關鍵能力,其中哪些是你的核心優勢,并且這個優勢目前還沒有被其他團隊充分利用。基于自身優勢去尋找市場機會,這才有意義。所以核心并不是簡單地看競品有沒有做什么。
當然,看到市場上有競品,發現某個點他們沒做到,我們去填補,這一定。但有時如果認知不夠深入,可能會發現沒人做某個方向是有原因的,比如它需要某種特定能力而大多數團隊不具備。但如果你恰好擅長某方面,那么我認為無論何時進入,只要想清楚了,并且確信自己能做得比現有方案更好,或者您認為別人做得不如你,那就可以去做。
我認為很多時候,創新與團隊自身的特質和核心能力緊密結合,會更有競爭力。比如我們的競爭優勢,也是從一開始就基于我們自身特點考慮清楚了要做什么,才朝著這個方向前進的。如果說先去研究競品再找差異點,我覺得這種思路是滯后的。
競品分析是產品經理的工作,想清楚目標才是創業者的工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.