字節在 AI 應用層的探索還在繼續,而且仍然保持遍地開花的探索策略。
根據我們不完全統計,字節跳動旗下目前已經有 11 款面向 C 端用戶的獨立產品,涉及 AI 創建平臺、AI 聊天工具、教育、互動劇情、修圖等 5 個類別。
除了在《半年連推 7 款產品,AI 時代字節也能大力出奇跡嗎》和《字節 Gauth,海外碾壓作業幫》兩篇文章中提到的 8 款產品,今天又帶來了 AI 生圖產品 PicPic、AI 教育產品河馬愛學、AI 劇情互動產品貓箱 3 款 App。
下文將借助具體的產品,分析字節跳動在做 AI 應用上的一些思路和策略。
PicPic:AI 寫真+文生圖,海外復制妙鴨相機之路?
PicPic 是字節跳動面向東南亞市場推出的定位“妙鴨+Dreamina”的 AI 生圖產品。
不同于妙鴨相機需支付 9.9 元才能開始制作自己的數字分身,PicPic 目前包括建立數字分身、選擇模板、文生圖在內的生圖功能均免費向用戶開放。
根據點點數據,PicPic 自 2024 年 2 月 8 日上線以來累計獲得了 11 萬次下載,其中 75% 來自菲律賓,余下來自馬來西亞。
從市場選擇和變現策略來看,PicPic 似乎并不需要承擔太多營收指標。而且從 Cici、BagelBell 等產品的上架和營銷區域來看,字節似乎更傾向于先在東南亞市場進行產品測試,取得一定結果后再帶到中國市場和其他市場。總體來看,盡管產品很多,但在實際投入上似乎更加傾向于保守路線。
另外,其實在過去的這些年明顯能感覺到字節是“時光機效應”的受益者,不過不同于古早互聯網時期將海外產品思路帶回國內,字節運用自己獨特的本地化優勢和增長能力將已經在國內或者其他區域市場得到驗證的產品帶到全球,從目前上線的產品來看,似乎在 AI 時代仍打算繼續延續該思路。
AI 分身
系統在掃描用戶的正臉、左側臉和右側臉的照片之后即可直接生成 AI 分身,不過為了獲得更好的效果,PicPic 鼓勵用戶上傳 3-8 張正臉無遮擋照片,等待一小時左右可生成分身。
在分身的生成上,PicPic 比妙鴨相機更方便,在制作妙鴨相機分身時用戶需要上傳 14-50 張多角度、多表情、多光線的照片。
首先,值得肯定的是 PicPic 生成的數字分身與用戶自身的相似度非常高,特征捕捉非常準確,而且不會過度美顏和美化。
但是或許是由于會捕捉到川字紋、法令紋等這些在臉上都不明顯的動態紋,所以體驗期間偶爾會有“一鍵換臉”的既視感。
而生成分身之后,用戶主要有三個使用分身生成寫真的方式:
1、直接使用系統預設的 AI 分身模版,目前 PicPic 提供古典藝術、蟲晶蝶舞、城市漫步三個預設模板,數量相對較少。
從生成結果來看,每組照片會給出 4 種選擇,用戶可以從中選擇自己感興趣的一張,如若不滿意也可重新生成,照片的風格與預設風格一致,而且成功概率也比較高。
但也存在生成結果并不穩定的情況,比如蟲晶蝶舞的 2 圖和 4 圖出現了面部變形、脖子變形的情況;城市漫步四張圖片中有三張圖片沒有手,有手的一張還出現了多手指、手指扭曲的情況。
相比之下,妙鴨相機的模板選擇更為豐富、生成的結果也更為穩定,另外除了常規的模板風格,妙鴨相機還會針對節日和重大活動推出相應模板,比如情人節、婦女節、春日、冬日、圣誕等等,從這點來看,不僅增加用戶的可選性,更是提升復購和留存的好方法。
妙鴨相機
而從模板本身的完成度來看,個人覺得 PicPic 生成的結果還是更像 AI,但妙鴨相機生成的效果更像是藝術寫真,盡管有較為明顯的美顏和修圖處理。
妙鴨相機
2、通過對主體、環境、氛圍和風格的關鍵詞描述生成想要的分身寫真,通常需要 4 分鐘左右可以生成。
用戶可以完全自定義關鍵詞,也可以從系統預設的 AI 靈感標簽中直接選擇,PicPic 按照將所有關鍵詞分成角色、發型、服裝、配飾、動作、美顏、室內、室外、主題、元素、燈光、藝術風格、色調、效果等 14 個類別,不限標簽數量。
從生成的結果來看,筆者自定義填寫的 2 寸證件照、吊帶郁金香、戰國袍奔跑照、紅色晚禮服,四次關鍵詞預設效果均未達到預期,其中最為主要的問題出現在關鍵詞理解錯誤。
當筆者將提示詞換為英文后,得到的照片相關度會有所提高,但整體的穩定性還是會差一些。
另外,我們注意到或者是暫未攻克“手”的處理難題,在生成的結果中,PicPic 似乎在故意“隱藏手”,要么截掉手的部分、要么自動設定插兜、抱胸等動作,而在難以避免的露手圖片中,手指數量錯誤、手指比例失衡、關節扭曲的情況時常發生。
在使用系統設定的關鍵詞靈感生成標簽來看,也同樣會出現關鍵詞理解錯誤、關鍵詞缺失、手指錯誤等情況,其中生成的刺猬頭圖片重新定義“刺猬頭”發型。
整體上,使用關鍵詞描述生成的分身效果未達到直接可使用的程度,不過值得肯定的是,生成的結果中五官結構較為穩定。
3、直接使用靈感廣場感興趣的照片并使用已經預設好的關鍵詞,一鍵生成。暫時無法確定靈感廣場的關鍵詞是來自用戶還是官方,不過使用非常便捷,選擇喜歡的照片直接點擊使用生成分身即可得到同款。這也是現在很多 AI 生圖社區的 Remix 功能的簡版。
從結果來看,靈感廣場的生成效果與 AI 分身模板接近,基本上可以達到看到的效果。
不過當留意細節時,就會發現身體比例失調、眼神亂瞟、手指錯誤等情況也時常發生。
不過不知道是關鍵詞還是投喂素材的原因,感覺審美有點老舊,經常會覺得自己穿越回了 21 世紀初...
除了生成這一部分,用戶還可以對已經生成的圖片進行風格選擇和擴圖,風格改造速度非常快,而且完成度較好,擴圖則永遠在等待...
AI 圖片風格化
用戶可以為上傳的照片選擇模板或者設定關鍵詞改變圖片原有風格,目前 PicPic 提供傳統漫畫、3D 角色、賽博朋克、極簡藍白、水彩、經典漫畫、黏土、涂鴉風、蒸汽朋克、像素風、溫柔漫畫、黑白鉛筆、漫天泡泡、海底世界等 14 種種不同的風格。
為了測試不同風格的完成度和效果,我們選擇了近期熱播的電視劇《與鳳行》的女主趙麗穎和男主林更新照片作為測試對象。
雖然風格對應準確,但似乎人物特征捕捉得并不好,幾乎每一張照片都無法看出照片原本的樣子,顯然這在當前市場中競爭力并不強。
AI 生圖
在 PicPic 里,用戶還可以通過自定義關鍵詞直接生成照片,PicPic 的優點是生成速度非常高、而且一個描述會生成多種不同風格供用戶參考。
另外,仍然是英文提示詞效果比中文提示詞效果更好,不過關鍵詞理解錯誤、人物與物品扭曲/錯位、運動方式錯誤、人物數量錯誤、年齡識別錯誤、長度/高度錯誤等問題仍然存在,甚至像是文生圖進入大眾視野初期會出現的問題。
不過直接拿 PicPic 與妙鴨相機對比也算不上公平,妙鴨相機已經經過了一段時間的發展和調整,而PicPic 才上線 2 個月,還是要觀察其后續發展。
另外,盡管我們前面已經提到 PicPic 可能暫時不需要“扛業績”,而且當前用戶基數也不大、強大的中臺能力讓消耗的成本也相對可控,不過從免費分身、東南亞市場變現方式來看,想要實現 ROI 轉正可能并不容易,這一點是可能需要想在東南亞做 AI 數字寫真的創業者結合自身業務和儲備資金做相應的考量。
貓箱:AI 劇情互動,沉浸式陪伴表達
貓箱,也是字節跳動在海外測試成功后帶回國內的又一案例,作為一家全球化公司,字節已經習慣性地將同一需求在國內和海外進行雙向驗證。
根據點點數據,2024 年 3 月上線的貓箱(原名話爐)累計獲得了來自 App Store 的 5 萬次下載,其他應用商店的數據要稍多一些,各端均在 10 萬次以上。
相比之下,更早上線的貓箱海外版 BagelBell 已經獲得了 120 萬次下載,主要來自印尼、菲律賓、巴西和馬來西亞。而在我們 2 月發布的文章中 BegelBell 的下載還不足 20 萬次,也就是說其在過去的三個月獲得了 100 萬次新增。
在功能上,貓箱與 BegelBell 差異不大,具體可見《半年連推 7 款產品,AI 時代字節也能大力出奇跡嗎?》中對 BegelBell 功能和體驗的描述。
另外,有趣的是雖然市場變化,但受歡迎的劇情仍然是戀愛、校園、霸總、狼人、年下,不過貓箱中出現了更多武俠、宮廷、神話、穿越智能體,這也和國內用戶喜歡的題材相契合。
另外,從筆者體驗以及用戶反饋來看,貓箱中 AI NPC 的“人設”要比 BagelBell 的更加穩定,甚至能扛過多次重復測試。以筆者測試的一位冷血魔尊為例,當對方表示自己中毒并在徹查原因時,筆者重復“你在干嘛”5 次,對方均給出的不同的回答和表現,而且生氣怒度不斷上漲。
另外,相較于 BagelBell,貓箱中聲音的設定變得更加符合 AI NPC 人設,體驗感和沉浸感有所增加。
AI 劇情互動領域的參與者越來越多,大廠、社交創業者、AI 創業者都在嘗試入局,更有趣的是在這個過程中社交和游戲的邊界正在逐漸模糊,甚至會有從業者表示“乙女游戲,要小心了”,不過從創業者對話和用戶調研結果來看,多模態的互動方式以及更加穩定的人設可能才是高留存和高變現的關鍵。
河馬愛學:AI 時代,字節教育會不一樣嗎?
河馬愛學是字節跳動 2024 年 1 月面向國內市場推出的AI教輔平臺,綜合了文生圖、文生文等多項 AI 技術,提供作業批改、作文指導、解題思路以及劇情互動等多項服務。
這也是目前字節跳動浮出水面的第二款 AI 教育產品,在白鯨出海前幾天的《字節 Gauth,海外碾壓作業幫》文章中提到 Gauth 在海外拿下了不少 MAU,憑借 AI+ 真人的雙輪策略以及豐富的題庫,Gauth 拿到了 AI 教育領域的入場券。
而河馬愛學,則仍在發育期,由于國內的產品下載分散在各個應用商店,我們無法統計準確的下載和活躍數據,但從各個應用商店顯示的下載量來看,似乎仍在早期發育階段。
河馬愛學官方將功能分成問答、學習工具和素養提升三大類別,具體到功能來看,實際上提供作業批改、口算批改、作文批改、語文作文、英語作文等 10 項功能。
作業批改、口算批改、作文批改
用戶直接拍照上傳作業,系統會對作業進行自動掃描并判定對錯,除了單純的對錯,河馬愛學還會給出正確答案、錯誤原因、改題思路等,幫助用戶改正錯誤。
拍題解題的需求在國內已經經過作業幫和小猿答疑(原小猿搜題)的驗證,字節也算借著 AI 東風加速向前。
從筆者的測試體驗來看,批改準確率較高,而且會根據用戶的年級給出針對性的建議,但是對卷面的整潔度以及拍攝的清晰度有一定要求,卷面較亂或者分區混亂的情況下可能會出現誤判。但卷面整潔其實是對學生尤其是低年級學生一個不低的要求。
語文作文、英語作文
河馬愛學會根據用戶設置的命題給出作文建議,幫助用戶更好理清題意、獲得高分。
其中英語作文會在用戶填寫完成題目后,結合用戶當前所在年級給出推薦時態、寫作要點和易錯點,另外還會給出一些可能用到的單詞、詞組、句型和例句,幫助用戶表達正確但是不會給出范文。
語文作文則更加細致,用戶除了要設置題目還需設置作文要求的文體和字數,系統會根據用戶設置內容給出題目分析、立意角度、選材建議、提綱建議和范文。
而且需要驗證家長身份后才可查驗,充分考慮到了孩子可能會直接照搬范文的情況。
文學素養和互動故事
相較于以上兩個更傾向幫助用戶更好地完成作業,文學素養和互動故事更像是幫助用戶進行思維發散和邏輯鍛煉。
在文學素養場景下,用戶需要先選中想要進行深度了解的古詩,并會在接下來的劇情中扮演一個角色,通過多人、多地探訪了解古詩背后的故事,而在了解古詩的過程中用戶需要正確回答 AI NPC 提出的與古詩相關或詩人相關的問題才可進行下一步。當用戶回答錯誤時,AI NPC 會鼓勵用戶再次思考和嘗試,或者給出提示。
河馬愛學借用了游戲的闖關設定,用戶只有在完成與上一個 AI NPC 的互動后才可能遇見下一個 AI NPC,來推動情節繼續向前發展,可以在保持趣味的基礎上,幫助用戶在鞏固古詩的基礎上打開視野、養成探究的好習慣。
在互動故事場景下,用戶需要先選擇古詩題材和故事背景,之后還需要在系統提供的品質中找到所扮演的主角具備的主要品質,并與 AI 一起續寫故事完成故事的創作,河馬愛學選擇的很多是科技、懸疑、奇幻、魔法、冒險題材,可以幫助學生鍛煉想象力。
通常情況下,故事在進行至少 5 輪以上的對話后,才可生成結局,因此用戶需要根據設定的目標推導盡可能合理的劇情來推動故事發展,而且根據用戶所選特征不同,過程中會解鎖不同的能力,另外還會伴隨知識科普,在探索結束后用戶可以更詳細地了解相關知識。
圖片創作
用戶可使用河馬愛學進行語音生圖、文字生圖和頭像制作功能,通過進行關鍵詞的設定生成符合自己需要的圖片。從體驗來看,生成風景和動物的結果,要比生成人的結果表現更好,相較于目前行業生成效率來看,速度還是略慢了一些。
河馬愛學 AI 生成圖片
學習互動、趣味挑戰
河馬愛學將豆包、Cici 的對話互動模式引入平臺,用戶可以直接以對話的方式了解和學習,從體驗來看應該是有進行針對性訓練,在進行一些發散性問題思考時,會有意引導用戶進行自主思考。
另外,用戶在與河馬愛學 AI 鹽鹽互動時可以進行趣味挑戰模式,參與“你畫我猜”“21 問猜詞”和“情景挑戰”,用戶需要在規定次數或者規定條件下給出正確答案或者完成任務即可獲得勝利,比較適合學生進行短暫放松和調節。
筆者將該應用安利給了身邊三位二年級、六年級和初二學生的家長請他們幫忙測試,對方表示確實節省了一些基礎問題的時間,但面對復雜題型表現不如預期,另外卡頓、加載過慢的情況也時有發生。另外,其中兩位低年級學生家長表示,孩子很喜歡互動故事。
盡管,關于教育的風向和政策在不斷變化,但就實際情況來看,教育仍然是剛需中的剛需,這也是字節跳動為什么會在教育領域拼拼出手的原因,不知道 Gauth 和河馬愛學等 AI 教育產品能否幫助字節跳動獲得教育賽道的頭部玩家入場券。
整體來看,字節選擇了“最火”的 3 條賽道繼續推出和迭代新品,來盡可能提升實現 PMF 的成功率,而在不同賽道的產品里,AI 生成功能又有所交叉,來提升能力的有效復用。
對于字節這樣的大廠來說,雖然 AI 生成功能依然有些不穩定,但依然是唯快不破。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.