關于愛詩科技的復盤與思考。
作者|王博
創始人坐在一個簡潔、干凈的場景中,用一句“Hi”開始全英文介紹,強調產品是“前所未有”“劃時代”“首個”“通用性”,并搭配流暢的動畫和現代化的UI設計演示,首發在海外社交媒體平臺……這樣的宣傳視頻,似乎成為了近期很多國產AI Agent產品發布時的“標配”。
這樣做的目的就是為自己產品打上“全球化”的標簽,吸引海外用戶。
盡管部分宣傳視頻伴隨著爭議,但是海外市場的認可度及其對國內市場的影響,又被提到了一個新的高度。
宣傳視頻只是一種流量手段,但怎樣才能真正獲得并留住用戶呢?
目前,AI Agent產品還處于市場布局階段,我們不妨把目光放到一年多前被Sora點燃AI視頻生成賽道。
AI視頻生成賽道的競爭十分激烈,但目前的AI視頻生成產品在功能上存在一定的同質化現象,很多產品都提供了文生視頻、圖生視頻、風格遷移、視頻模板等功能,各家在卷的技術也集中在視頻主體一致性、運動軌跡控制、首尾幀生成、生成速度、清晰度、生成時長等方面。當某個競爭對手推出了用戶歡迎的新功能時,其他公司為了不落后,往往會迅速跟進甚至模仿,導致功能的快速“標配化”。
就是在這個賽道,跑出了一款總用戶超6000萬,月活用戶超1600萬的產品——PixVerse。
PixVerse是愛詩科技旗下的AI視頻生成產品,就公開數據而言,PixVerse是全球用戶量最大的AI視頻生成產品。
然而,愛詩科技當時并沒有做“發布”的動作。2024年1月,PixVerse直接在海外上線,一個月后其月訪問量就超過了100萬。
經過這一年多的發展,PixVerse從國產AI視頻生成產品全球化路線的先行者,成為了真正被全球用戶認可的頭部AI產品。
今年5月,PixVerse V4.5在海外上線約一周,就沖到了美區App Store免費總榜第四位,圖片視頻工具榜單第一位。
PixVerse在美區App Store排名,圖片來源:App Store
「甲子光年」認為,在AI視頻生成賽道,當某項產品的月活用戶超過1000萬并且持續穩步增長時,就可以被貼上“中型成熟”的標簽。這意味著它已成為行業里值得重點關注的中堅力量,接下來的競爭將不再是“功能是否可用”,而是“生態擴展、多元商業化與持續創新”的競爭。
愛詩科技通過PixVerse把AI視頻生成產品從專業小眾工具推向億級大眾市場,在全球AI視頻生成賽道里已形成“中型成熟”產品的頭部樣本。
近期,PixVerse國內版“拍我AI”正式上線,國內用戶可以在App端和Web端登錄“拍我AI”使用最新的PixVerse V4.5模型。保守估計,“拍我AI”將帶來千萬量級的用戶增長。
從PixVerse到“拍我AI”,一個國產AI視頻產品如何吸引全球6000萬用戶?
1.兩次“縱身一躍”
“你為什么想不開,出來創業?”這是愛詩科技創始人、CEO王長虎兩年前聽到最多的話。
當時,絕大多數的投資人和業界專家都不理解他為什么要從大廠出來做AI視頻生成創業,他們認為這“在五年之內沒法落地”。
不過在2023年4月,王長虎還是開始了AI視頻生成創業,他把這形容為“不歸路”,這是他第一次“縱身一躍”。
愛詩科技創始人、CEO王長虎,圖片來源:2025北京智源大會
2023年7月,愛詩科技開始訓練AI視頻生成大模型,到了10月,相關評測就已進入全球第一梯隊。
“這一年的Magic Moment,是愛詩內部創作平臺上生成第一個視頻那一刻。它是一只小鹿,很萌,有個不大的動作,時長很短,清晰度也不夠,卻是我們走出的第一步,令人難以忘記。”王長虎告訴「甲子光年」。
王長虎團隊用AI生成的第一個視頻,來源:愛詩科技
2024年1月,PixVerse網頁端在海外上線,一個月后其月訪問量就超過了100萬,吸引了不少“自來水”用戶。
但是到了2024年2月,Sora發布了。
那天仍是春節假期,但王長虎的微信“炸”了,很多人對PixVerse的前景表達關切,甚至有人半開玩笑地說:“Sora出來之后,你們公司是不是完蛋了?”
但更多人還是對PixVerse抱有期待,王長虎印象最深的問題是“你們什么時候能趕超Sora”,他很謹慎地跟公司技術人員溝通后回應:“3到6個月。”
當時在國內外社交媒體上有一張AI視頻生成產品座次梗圖流傳很廣,PixVerse在海外網友的眼中處于追趕Sora的行列中。
Sora發布后,海外網友發的AI視頻生成產品座次梗圖,圖片來源:X
對于這張圖,2024年4月,王長虎在和《晚點LatePost》對話時說:“能被放在第一排,我們很高興。”
Sora是基于Diffusion Transformer(DiT)架構之上的文生視頻模型,它的成功驗證了DiT在視覺生成任務中的可擴展性與實用價值。
在愛詩科技成立之初,團隊采用過Diffusion Unet架構的技術路線,這是在Sora出現之前一種主流的文生圖、文生視頻模型生成路線。這個過程可以想象成將一滴墨水滴入水中,墨水逐漸擴散,而Diffusion模型需要學會如何將墨水從水中重新提取出來。
Unet架構在降低復雜度與保留細節度之間做到了很好的平衡,提升了模型的計算效率,模型的算力需求不會太高。但另一方面,如果要想模型越來越聰明,加入的參數越來越多,圖像或指令變得越來越復雜,Unet架構很容易陷入性能瓶頸,面臨擴展性問題。
由于Unet架構的局限性,愛詩科技在2023年規劃技術路線時,也包括了DiT架構。王長虎透露,當時團隊計劃在2024年春節前后,等拿到第二筆融資就開始訓練DiT架構的模型。
當時,Sora展示的Demo視頻震撼了全球,也讓王長虎陷入了糾結“跟,還是不跟”。
雖然愛詩科技在2023年發展還不錯,但當時公司的現金流只夠支撐一次訓練模型的機會。
“訓練不成功就完蛋了,沒有第二次機會,你搞不搞?是繼續訓練大模型,還是放棄,轉身做應用?”王長虎說,“但是創業就是‘縱身一躍’,這一跳都跳了,第二跳還怕什么,所以決定All in。”
第二次“縱身一躍”后,PixVerse進入了快速發展期。
2024年4月,王長虎在和《晚點LatePost》對話時談到當時狀態很像在西北戈壁徒步,“走到中途,前后都看不到人。Sora的出現意味著走著走著發現前面還有一個人,我的開心大過緊張,因為這個方向是對的,我沒有走偏,并且還有機會超過它。”
2024年5月,智源研究院發布文生視頻模型評測結果顯示,PixVerse位列全球前三,在國內同類型產品中表現最佳。
多模態生成模型評測結果,圖片來源:智源研究院王博王博王王
2024年12月,SuperCLUE中文大模型綜合測評基準發布AIGVBench-T2V文生視頻測評榜單,PixVerse V3模型總分排名第一,海螺、可靈1.5等緊隨其后。
AIGVBench-T2V文生視頻測評榜單,圖片來源:SuperCLUE
PixVerse保持著大約2個月迭代一次版本的速度,不斷為用戶帶來新的創作能力和體驗。
PixVerse發展歷程,圖片來源:愛詩科技
王長虎曾表示,愛詩科技不會局限在一種技術路線,未來會多種技術路線共同探索,“一方面用Transformer路線進一步提升基座模型能力,并加入可控生成技術;另一方面會持續探索自回歸路線,增強時空建模,并建立各個模態間統一范式。”
而對于兩次“縱深一躍”的看法,有過字節跳動工作經歷的王長虎引用了字節跳動創始人張一鳴的話——“務實的浪漫”。
什么是“務實的浪漫”?張一鳴的解釋是“把想象變成現實,face reality and change it”。
在2024年第四季度,務實的王長虎迎來了浪漫時刻:單季度整體實現10倍用戶增長,月活用戶數量達到了1600萬。
2.先做To C,再做API
在AI視頻生成領域,頭部玩家的月活大多在百萬量級,少數可以達到千萬量級,1600萬月活直接讓PixVerse和競品拉開了一個身位,這意味著PixVerse已經從“成長型”產品一躍進入“中型成熟”產品行列,展現出極強的市場滲透力和商業化潛力。
但是在早期,愛詩科技的產品路線是To C還是To B并不清晰。王長虎后來拍了板,先做To C業務,再針對B端提供API服務。
“我們要做好兩件事情:第一,如何降低普通人創作門檻;第二,如何提升普通人的創作體驗。”王長虎說。
在AI視頻生成領域,一個關鍵的討論是“什么是AI視頻大模型的ChatGPT時刻”?王長虎認為,當普通用戶也能用起來時,才是ChatGPT時刻。
王長虎認為這一時刻出現在去年10月,PixVerse V3上線后。憑借PixVerse V3強大的基模和產品能力,用戶只需要上傳照片選擇視頻模板,不需要輸入提示詞(Prompt)就能生成視頻,通過這種方式,視頻抽卡概率提升到接近100%。
隨后12月,PixVerse很快上線了移動端App并升級大模型到V3.5版本,PixVerse迅速增長為全球用戶量最大、熱度最高的視頻生成平臺,持續在Google Trends上領跑行業,登上歐洲及中東多國App Store總榜、影像榜第一;Google Play美國地區人氣增速榜第一。
移動端App的推出,讓AI視頻創作不再局限于Web端,這極大地降低了用戶的使用門檻,契合了移動互聯網時代用戶碎片化、隨時隨地的創作需求。
“我們的變身特效和擁抱特效等AI視頻模版也在全球社交媒體上接連爆火。通過極致的工程化和產品化能力,我們讓AI視頻技術真正進入了每個普通人的娛樂生活。”王長虎告訴「甲子光年」。
PixVerse視頻模板示例,動圖來源:愛詩科技
不要忘了,抖音就是從15秒短視頻和炫酷的視頻模板做起來的,而AI視頻生成產品的模板相比之前的短視頻模板,給用戶帶來了全新的體驗。
王長虎近期在對話《晚點LatePost》時解釋:“短視頻里的特效不是端到端的,每一個特效都要針對性去調整、設計;而用生成技術產生模版,效率高很多,同時能讓用戶也參與貢獻模版,不是光靠我們的團隊在做。這是過去的短視頻特效沒有的生產機制——所以我們的模版內容多元、足夠有差異化。”
今年5月,PixVerse V4.5在海外上線約一周,就沖到了美區App Store免費總榜第四位,圖片視頻工具榜單第一位。
那么,海外用戶的真實評價是什么?
「甲子光年」通過Grok 3搜集了PixVerse V4.5在海外上線前后(5月7日到5月14日)X平臺用戶對PixVerse的評價,總計56個來源,包括中文、英文、日文、葡萄牙文等,Grok 3給出的結論是:
用戶對PixVerse的評價總體積極,特別是在視頻質量和功能創新方面。 少數用戶提到某些功能(如Fusion)結果可能不可預測,但仍持正面態度。 搜索未發現顯著負面評論,反映用戶對該工具的普遍滿意度。
Grok 3搜集的X用戶對PixVerse的評價,圖片來源:Grok
X用戶對PixVerse的正面評價主要集中在三個方面。
首先是生成視頻質量。X用戶@iriya_anju針對PixVerse V4.5給出了詳細評分:畫質9分(“優秀但未達到每根頭發可見的程度”),分辨率9分(支持1080p),動作流暢性9分(“非常流暢且幾乎無破綻”),功能性10分(“非常豐富,合成和角色參考功能水平高”)。X用戶@levelsio更稱其為“當前最先進的(SOTA)視頻模型”,強調其角色一致性。
第二是用戶體驗。PixVerse V4.5版本的升級顯著提升了用戶體驗。X用戶@yudotanaka提到,新版本生成時間縮短至約10秒且積分消耗有下降,并稱其為“最佳體驗”。還有很多用戶分享了使用PixVerse的創作成果,并對工具的創新性和藝術性表示贊賞。例如,X用戶@SarahAnnabels稱“無需攝制組即可制作電影級AI視頻”,列舉了新功能的使用方法。
第三是新功能。PixVerse V4.5新增的電影級運鏡控制和支持多主體功能(Fusion)受到廣泛好評。X用戶@Damn_coder表示PixVerse適合創建舞蹈頭像、電影鏡頭和病毒式視頻混剪。
Grok 3在搜索結果中,僅有少量的功能改進建議,未發現強烈的負面評價。
Grok 3搜集的X用戶對PixVerse的評價,圖片來源:Grok
這些評價雖然比較主觀,但是代表了海外真實用戶的感受。
在AI視頻生成這個高度依賴技術的領域,PixVerse顯然在底層算法和模型訓練上擁有顯著優勢,模型不斷迭代,能夠生成高質量、有吸引力的視頻內容,這是用戶選擇并留下的最直接原因。
另外,PixVerse不僅僅是提供一個“能生成視頻”的工具,而是深入理解了用戶在視頻創作過程中遇到的實際難題,并通過獨特且實用的功能提供了有效的解決方案。這種以用戶為中心的創新,極大地提升了用戶體驗和產品粘性。
而現象級的傳播效應則放大了模型和產品的影響力。當產品本身足夠優秀,又能有效觸達潛在用戶時,用戶規模的爆發式增長就變得順理成章。
PixVerse的高用戶量和活躍度并非偶然,而是其在技術、產品、運營和市場策略上協同發力的結果。
今年,愛詩科技也面臨兩大挑戰:從C端到B端,從海外到國內。
3.C端的沉淀帶來B端的洞察
由于去年第四季度PixVerse的爆火,當時很多B端客戶找到了王長虎,希望接入PixVerse的API。
雖然PixVerse率先在C端市場發力,但這并不意味著愛詩科技不做B端市場。
“我們已經有基于6000萬用戶的實踐了,我們知道他們喜歡什么,他們愛用什么,他們怎么用,這些能力真的可以賦能全球B端客戶。”王長虎說。
愛詩科技在今年1月份逐漸開展B端業務。對于企業用戶,愛詩科技設置了優先通道,可提供易用、快捷的API在線服務接口,通過標準輕量化的接口極大提升集成效率;同時,愛詩科技還可提供多元的視頻生成功能和豐富的模板;而對于企業關心的安全問題,愛詩科技支持高并發和高可用性保障,數據加密和安全合規體系可提供全方位的保障。
對于B端客戶,“AI生產力”的概念非常重要。
其核心在于將AI視頻生成能力融入企業工作流程,提升內容生產的效率、降低成本、支持規模化和個性化內容產出,最終服務于企業的商業目標和增長。
愛詩科技擁有的不僅僅是AI視頻生成產品,還有持續積累的用戶運營服務經驗——C端長期的沉淀,帶來B端深刻的洞察。
目前,愛詩科技的B端業務場景集中在廣告、短劇和游戲。
在廣告場景,基于強大的底模以及穩定快速的LoRA生成效率,相關產品可以在商品展示、口播、特定SKU廣告等場景快速批量生成大量素材,幫助企業大量節省廣告制作成本。
在短劇場景,相關產品可通過對分鏡關鍵幀的鏈接,完成高質量短劇的創作,并對不同角色進行形象替換,幫助短劇創作者進行內容IP重構。
在游戲場景,相關產品通過更高的清晰度、更豐富的細節和穩定的動作表現力,幫助游戲企業在場景資產、概念向角色設計以及激勵廣告的批量生成上大幅提升效率。
PixVerse憑借極致的高速與穩定輸出、企業級PGC工具和開放式生態合作,一方面讓創作者能在短視頻時代用極短時間產出高質量、有趣且連貫的內容,極大提升了用戶的裂變與增長效率;另一方面,它為藍色光標、思為科技等企業客戶提供一站式視頻營銷與私域運營素材生成服務,顯著降低了內容生產與獲取成本。
同時,PixVerse正在與百度智能云、Fal.ai、Eachlab等技術伙伴深度協作,加速圖文到視頻的場景化落地,并與百度文庫聯手,將靜態文檔動態可視化,讓知識類內容輕松生成旁白和動畫,使得從文檔到視頻的創作流程更為流暢與生動。
4.“拍我AI”的使命
AI企業出海有一個誤區:必須在國內先把產品做好,再把這個產品賣到國外去。
這并不是說產品打磨不重要,而是說前期的產品打磨不能只針對國內市場。出海是一個主動的策略,而不是被動的調整。既然想要海外市場,那么產品發布的第一天就要面向全球市場,要把出海的視角轉為全球化的視角。
去年4月,王長虎在和《晚點LatePost》對話時就有相關表述:“做AI時代的產品就應該做全球產品。”
選擇先海外后國內路線的另一個客觀原因是公司初期“人手不足”。
如今,愛詩科技帶著Pixverse在海外的積累會回到了國內,“拍我AI”的上線,意味著愛詩科技進入了一個新的發展階段。
“拍我AI”上線,視頻來源:愛詩科技
「甲子光年」認為,中國擁有龐大的短視頻用戶群體和活躍的內容創作生態,AI視頻生成技術在這里具有巨大的應用潛力和市場空間。然而,中國用戶的需求、使用習慣以及內容偏好與海外市場存在差異。“拍我AI”的推出,不僅僅是簡單的本地化,更需要針對中國市場的特點進行產品優化和運營策略調整。
王長虎介紹,“拍我AI”會對齊PixVerse最新的基模和所有的功能,同時它是一個中國的模型,有中國風、中國味的模板和內容。
愛詩科技在海外市場積累的技術經驗和用戶運營能力,將為“拍我AI”在中國市場的推廣提供寶貴的基礎。同時,通過服務中國用戶,“拍我AI”也能獲取更豐富的中文語料和用戶反饋,進一步反哺模型的訓練和迭代,形成全球范圍內的技術和產品協同優勢。
“拍我AI”的使命,是將在全球范圍內得到驗證的AI視頻生成能力,無縫對接到中國本土的內容創作和消費場景中,吸引并賦能更廣泛的中國用戶群體,進一步壯大愛詩科技整體用戶基礎。
盡管PixVerse在全球市場取得了成功,但對于愛詩科技而言,服務好中國市場,對于其C端和B端的用戶增長至關重要。
王長虎很清醒,“過去兩年很成功,不代表未來兩年能成功。”
他只是覺得自己特別幸運,“創業兩年,依然留在了牌桌上。”
(封面圖來源:PixVerse生成視頻截圖)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.