文 | 新識(shí)研究所
字節(jié)AI應(yīng)用正進(jìn)入加速時(shí)刻。
4月份,字節(jié)AI部門Flow旗下發(fā)生人事變動(dòng),并將一些業(yè)務(wù)重合的應(yīng)用進(jìn)行整合。AI社交應(yīng)用貓箱原負(fù)責(zé)人梁琛奇離職,由原AI生圖應(yīng)用星繪負(fù)責(zé)人西原(花名)接任,且星繪團(tuán)隊(duì)計(jì)劃并入豆包,由豆包APP端負(fù)責(zé)人陸游(花名)一起管理。
同一時(shí)間,AI應(yīng)用開發(fā)平臺(tái)「扣子空間」正式啟動(dòng)內(nèi)測(cè),依托字節(jié)生態(tài),辦公場(chǎng)景的結(jié)構(gòu)化任務(wù)執(zhí)行效率更高,一上線便受到玩家追捧,被譽(yù)為字節(jié)跳動(dòng)版“Manus”。
5月份,剪映推出了新一代AI營(yíng)銷內(nèi)容創(chuàng)作平臺(tái)「Pippit AI」,悄悄登上周榜第一。又在國內(nèi)上線了兩款A(yù)I產(chǎn)品,一款是搭載火山引擎的豆包大模型,可以利用AI一鍵剪輯的「剪小映」,可以理解為剪映的“傻瓜版”。
另一款「小云雀」則是一款面向短視頻創(chuàng)作者、電商營(yíng)銷人員以及普通用戶的AI視頻和圖片創(chuàng)作助手,內(nèi)容創(chuàng)作能力會(huì)更強(qiáng),更專業(yè)。
自2023年發(fā)布文生圖AIGC工具「即夢(mèng)」以來,剪映曾一度沉寂,而近一個(gè)月內(nèi)突發(fā)3款A(yù)I創(chuàng)作工具,作為字節(jié)AI戰(zhàn)略的重要一環(huán),到底是適時(shí)的“秀肌肉”還是被對(duì)手“逼急了”?
AI工具三連發(fā),字節(jié)能讓普通人有手就會(huì)嗎?
經(jīng)過新識(shí)研究所的實(shí)測(cè),上述幾款A(yù)I工具都有自己的強(qiáng)項(xiàng)和可取之處,但需要改進(jìn)的問題也不少。
「剪小映」的功能非常簡(jiǎn)單,用戶手機(jī)的本地相冊(cè)內(nèi)只需有拍好的照片和視頻,就能根據(jù)這些素材智能成片,生成的視頻可直接導(dǎo)出文件保存在APP里,或者一鍵分享至抖音、小紅書、微信等。
創(chuàng)作界面內(nèi),雖然是自由選擇素材,但至少要選擇3個(gè)以上的素材才能獲得理想效果的視頻,AI會(huì)對(duì)這些圖片進(jìn)行智能分析,制定出最適合的成片思路,包括模板推薦以及視頻主題等,如果不合適,也可以自行提供思路。
像用了三張美食照片的“日常分享”模板,得到的就是很常規(guī)的抖音vlog風(fēng),配以優(yōu)美抒情的文字和音樂,每次看到AI分析得頭頭是道,但是成品并沒有太驚艷的效果,而且給的方案風(fēng)格依賴預(yù)設(shè)模版,成品間不會(huì)有太大差異。
若選擇的是不同類型的照片或視頻,去硬湊成一個(gè)視頻,剪小映也能實(shí)現(xiàn),我們選取了風(fēng)景圖、藝術(shù)照和日常水果,AI給出的思路就是城市生活多樣之美,也算符合要求,但是圖片間的關(guān)聯(lián)度越少,生成的主題也會(huì)越缺乏邏輯。
不過目前剪小映不支持拍攝功能,僅能處理本地素材,無法修改字幕、配樂、畫幅等,無法覆蓋用戶從拍攝到二次創(chuàng)作的全流程,更像是“短視頻”速成工具,適合普通小白分享日常生活。
如果說剪小映是入門選手,小云雀就是專業(yè)選手。
與傳統(tǒng)AI工具單一通用輸入框不同,「小云雀」會(huì)讓用戶先選定場(chǎng)景,分為智能成片、數(shù)字人視頻、AI設(shè)計(jì)、AI背景四個(gè)核心功能,防止生成內(nèi)容偏離需求。
整個(gè)流程分為“創(chuàng)作想法-理解分析-創(chuàng)意腳本-剪輯成片”四個(gè)步驟,可以直接輸入提示詞,設(shè)置相應(yīng)參數(shù),讓小云雀AI自己匹配素材,也可以上傳本地圖片素材,根據(jù)你的圖片和提示詞要求生成。
期間會(huì)放出AI的思考和決策過程,提供4個(gè)相關(guān)的方案,用戶可以在任意環(huán)節(jié)進(jìn)行修改,也可以直達(dá)最后產(chǎn)出階段。
產(chǎn)出的海報(bào)風(fēng)格統(tǒng)一,文案生動(dòng),視覺效果專業(yè),比較適配電商素材和vlog視頻,完全可以直接用于商業(yè)推廣。
其中最具創(chuàng)設(shè)性當(dāng)然是“數(shù)字人AI”,不僅可以用真人素材,也可以完全由AI生成。我們以“面霜廣告”為主題,要AI生產(chǎn)一段推廣視頻,最終得到一段有情緒起伏、前后反差、直擊用戶痛點(diǎn)的16面視頻,數(shù)字人表情自然,語音清晰,內(nèi)容條理分明,個(gè)別片段真有些“以假亂真”。
不過它也存在明顯的缺點(diǎn),有時(shí)候視頻中的文字會(huì)亂碼,生成的字幕風(fēng)格比較像營(yíng)銷號(hào),水印也不太好去除,還會(huì)生成一些不符合客觀事實(shí)的物體和人物,加上提示詞有字?jǐn)?shù)限制,想詳細(xì)描述場(chǎng)景時(shí)比較難。
總的來說,「小云雀」在商業(yè)側(cè)強(qiáng)調(diào)決策效率,讓創(chuàng)作者能夠快速將創(chuàng)意轉(zhuǎn)化為成品,在體驗(yàn)側(cè)追求簡(jiǎn)潔直觀,降低了技術(shù)門檻,對(duì)于電商和視頻的從業(yè)者提供了一個(gè)十分高效的創(chuàng)作工具。
而「扣子空間」更是十項(xiàng)全能,不管是制作PPT、視頻、音頻、寫代碼、生成網(wǎng)頁APP都信手拈來,目前分成了探索、規(guī)劃和自由三種模式,探索模式更偏向信息整理,規(guī)劃模式更偏向執(zhí)行任務(wù),自由模式則是交給AI自己去判斷用戶需求。
且扣子的內(nèi)容創(chuàng)作并不是死板的提取信息,它還會(huì)自己進(jìn)行理解并把晦澀難懂的信息用更生動(dòng)的方式表達(dá)出來,提供下載和分享鏈接。
除此之外,扣子也支持MCP協(xié)議,并接入了GitHub、MySQL數(shù)據(jù)庫、云文檔、天氣、地圖等一系列MCP應(yīng)用,進(jìn)一步簡(jiǎn)化大模型調(diào)用外部服務(wù)的流程。
盡管扣子空間降低了操作門檻,但要準(zhǔn)確地定義任務(wù)需求,依然考驗(yàn)著用戶的AI水平,需要投入足夠的時(shí)間去熟悉和掌握各項(xiàng)功能與使用技巧,才能真正將其潛力充分發(fā)揮出來。
可以看出,字節(jié)的AI工具從面向個(gè)人日常到商用設(shè)計(jì)都有涉獵,爭(zhēng)取做到“有手便行”的傻瓜式操作,對(duì)于C端用戶的爭(zhēng)奪可以說勢(shì)在必得。
字節(jié)AI戰(zhàn)線收縮,好鋼用在刀刃上
浙商證券一份報(bào)告指出,2024年字節(jié)AI資本開支達(dá)800億元,接近百度、阿里、騰訊三家總和,其2025年預(yù)算再翻倍至1600億元,其中900億用于GPU采購。這一投入強(qiáng)度遠(yuǎn)超國內(nèi)同行,甚至超過不少歐美科技巨頭年度AI預(yù)算。
AI助手類產(chǎn)品,是當(dāng)下競(jìng)爭(zhēng)最激烈,也最能體現(xiàn)基礎(chǔ)大模型能力的賽道,國內(nèi)主要產(chǎn)品有豆包、DeepSeek、元寶、Kimi等產(chǎn)品,海外有ChatGPT、Google Gemini等產(chǎn)品。AI產(chǎn)品榜數(shù)據(jù)顯示,今年4月份,豆包APP月活1.07億,位列國內(nèi)同類產(chǎn)品第二,DeepSeek、騰訊元寶緊隨其后,月活分別為9688萬和4143萬。
字節(jié)跳動(dòng)一直以來奉行“飽和式覆蓋”的策略,在AI領(lǐng)域推出了眾多產(chǎn)品,涉及聊天機(jī)器人、AI搜索、AI瀏覽器、Agent平臺(tái)、AI陪伴社交、AI教育等大部分主流應(yīng)用方向,但尚未在單一產(chǎn)品方向上形成碾壓性優(yōu)勢(shì)。
其AI社交產(chǎn)品“貓箱”與同類產(chǎn)品“星野”之間難分伯仲,AI視頻產(chǎn)品“即夢(mèng)”與快手旗下“可靈”在內(nèi)容創(chuàng)作和商業(yè)生態(tài)上走向分野,即便是用戶數(shù)據(jù)表現(xiàn)最突出的“豆包”,也被DeepSeek、騰訊元寶、KIMI幾大強(qiáng)敵環(huán)繞,時(shí)不時(shí)日活被其他競(jìng)品超越。
因此,字節(jié)開始整合旗下AI部門,提高資源利用率,助其找到AI戰(zhàn)略的突破口。
今年2月份,原Google DeepMind副總裁吳永輝入職字節(jié),成為Seed基礎(chǔ)研究負(fù)責(zé)人,后面字節(jié)AI Lab全部收歸Seed團(tuán)隊(duì)之下,Seed大語言模型(LLM)之下的三個(gè)團(tuán)隊(duì)Pre-train(預(yù)訓(xùn)練)、Post-train(后訓(xùn)練) 和 Horizon 也轉(zhuǎn)為直接向吳永輝匯報(bào)。
其后對(duì)Flow部門旗下產(chǎn)品進(jìn)行了資源整合,無論是人員變動(dòng)、戰(zhàn)略重心轉(zhuǎn)移,還是內(nèi)部的精簡(jiǎn)流程、聚焦主線,字節(jié)都在加速向一個(gè)以模型為核心、以組織能力為支點(diǎn)的轉(zhuǎn)型方向邁進(jìn)。
字節(jié)此前的綜合產(chǎn)品體系,雖然憑借自身技術(shù)儲(chǔ)備在規(guī)模上迅速擴(kuò)張,但始終無法在細(xì)分賽道建立絕對(duì)優(yōu)勢(shì),反而容易導(dǎo)致內(nèi)部資源的分散。于是將自身有限資源聚焦,專注提升基礎(chǔ)模型能力,并向豆包、即夢(mèng)這類表現(xiàn)優(yōu)異的產(chǎn)品傾斜,是當(dāng)下字節(jié)AI發(fā)展的策略,這也有助于其找到AI戰(zhàn)略的突破口。
隨著字節(jié)AI在視覺生成產(chǎn)品上的突飛猛進(jìn),高喊要All in AI的快手恐成最大輸家。
長(zhǎng)期以來,快手希望可靈扮演“破壁人”的角色,通過技術(shù)和產(chǎn)品在專業(yè)領(lǐng)域的應(yīng)用示范,吸引并激發(fā)PUGC和UGC創(chuàng)作者加入AI生產(chǎn)、消費(fèi)與互動(dòng),實(shí)現(xiàn)快手內(nèi)容生態(tài)和商業(yè)化場(chǎng)景的維度拓展。
不過從結(jié)果來看成效不明,今年一季度,快手線上營(yíng)銷服務(wù)的收入為180億元,同比增幅僅為8%,平均日活與月活用戶數(shù)分別為4.08億和7.12億,同比增速分別為3.6%和2.1%,雖有進(jìn)一步放緩跡象,但依舊高于行業(yè)的平均值。
可靈雖為公司貢獻(xiàn)營(yíng)收達(dá)到1.5億元,以此計(jì)算基本上穩(wěn)超全年4.5億收入目標(biāo),但與頭部公司相比杯水車薪,特別是剪映和CapCut一年近百億的總收入。
值得慶幸的是,目前可靈AI在推理層面已經(jīng)實(shí)現(xiàn)了邊際利潤(rùn)轉(zhuǎn)正。隨著業(yè)務(wù)規(guī)模的持續(xù)擴(kuò)大,即便未來進(jìn)一步增加對(duì)推理算力的投入,對(duì)集團(tuán)整體利潤(rùn)的影響也將相對(duì)有限。同時(shí)隨著技術(shù)迭代,可靈AI推理成本也會(huì)進(jìn)一步走低。
總體而言,“可靈”目前仍主要依賴C端用戶作為收入來源,B端應(yīng)用尚處于起步階段。對(duì)于視頻生成這類尚未大規(guī)模落地和普及的AI應(yīng)用來說,“可靈”當(dāng)前所取得的發(fā)展成果已屬難能可貴。
對(duì)快手而言,若希望將人工智能技術(shù)打造成推動(dòng)公司增長(zhǎng)的新引擎,一方面要實(shí)現(xiàn)收入的持續(xù)快速增長(zhǎng),另一方面則需在增長(zhǎng)過程中保持健康的盈利水平。
目前,“可靈”在技術(shù)和行業(yè)布局上展現(xiàn)出一定先發(fā)優(yōu)勢(shì),未來如何在業(yè)務(wù)擴(kuò)張的同時(shí)實(shí)現(xiàn)可持續(xù)盈利,仍是快手亟需破解的課題。
好在一個(gè)視頻生成模型,顯然是無法滿足國內(nèi)海量用戶的創(chuàng)作需求的,無論抖音還是快手,雖然業(yè)務(wù)處境不同,最終都能尋得自己的一方生態(tài)位。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.