普通用戶到底需要什么?
在 R1 推理模型大火之后,全民接力集成 DeepSeek,有硅基流動這樣的大模型云服務平臺、有騰訊元寶這樣的 Chatbot,甚至微信這樣的頂流。但是,AI 圖片類產品卻鮮少有接入 DeepSeek R1 的新聞,而從 DeepSeek-R1 發布到 Krea 宣布上線新功能僅僅 10 天,這個反應應該是圖像產品中最快的。
用 DeepSeek 降低門檻,Krea 率先“吃螃蟹”
在 Krea 之前,集成了 Chatbot 的生圖和改圖功能已經存在,最典型如 ChatGPT,但用過的讀者應該有一些感受,雖然疊加了 Chatbot 理解用戶意圖的步驟,但不論是生圖還是改圖,效果都不盡如人意。(可見下文案例對比)
而 DeepSeek-R1 的引入,讓這類功能的使用體驗有了一些變化,2 個點,深度推理且低成本。前者解決了可控,后者決定了,新技術可應用到商業產品中。
用戶用自然語言表達意圖時,不會像精心編寫的 Prompt 那樣清晰,DeepSeek-R1 則重在理解用戶意圖,而且 Krea 還給為了接近可用狀態所需要的后續操作,加了 buff。
如上面的視頻,加了 R1 就是為了降低門檻,讓用戶可以用自然語言生圖、改圖,所以后續的一些操作,例如改變風格、圖片生成動畫,Krea 都設置了便捷交互按鈕,但在交互上,其實是產品將按鈕功能“翻譯”成一句方便 R1 理解的話,從而讓生成結果接近用戶預期。
筆者也對 OpenAI 新推出的 o3-mini 推理模型和加入 R1 的 Krea,進行了生圖和改圖的對比測試。
生圖指令:Help me generate a picture of a sunset, beach, blue sea, coconut trees;
修改圖片指令:remove all coconut tree,注:Krea 生圖模型默認選擇Flux,ChatGPT 選擇的是 GPT-4o 普通模型和 o3-mini 推理模型,生圖模型為 DALL-E3
首先,筆者用相同的自然語言指令,讓 Krea Chat 和 ChatGPT(兩種模型)各生成一張圖片(如左圖),然后再向兩者同時下達改圖指令,要求將海灘旁的椰子樹去掉(結果如右圖)。
我們看到,Krea 和 o3-mini 模型都將椰樹去掉了,完成了任務,GPT-4o 生成的畫面中卻仍有椰樹。而兩個推理模型相比,o3-mini 改出來的圖像雖然去掉了椰子樹,但畫面幾乎等同于“重新生成”,Krea 令人比較驚喜的一點是,在幾種樹中只去掉了椰子樹,而且保留了原圖像的大部分元素,起碼能算是改圖。
效果差異的背后有 R1 和 o3 推理模型的區別,其實也會有生圖模型 Flux 和 DALL·E 3 的區別,由于沒有辦法進行交叉驗證,究竟是哪些因素影響了不同產品的改圖表現尚未可知。
這次,Krea 將 R1 集成到產品中,還有另一個前提條件——成本。
在考驗自然語言推理的 Zebra Logic 測試中,DeepSeek-R1 評分雖不如 OpenAI-o1,但評分卻比其他非推理模型高很多
注:上面測試中使用的 o3-mimi 上線時間晚于DeepSeek-R1,API 價格也高于 DeepSeek
雖然 OpenAI o1 是最早上線的推理模型,但由于其昂貴的使用價格,用于改善生圖效果并不現實,DeepSeek-R1 則完完全全將價格打了下來。
而 Krea 引入 R1,除了讓生圖和改圖更接近用戶預期之外,另一個層面的顯著收益是,讓使用門檻降了下來,不論是不用再去精心編寫 prompt,還是點一下就能進行后續步驟,都對普通用戶更加友好。
訪問量增長停滯,Krea 急于破圈
白鯨出海的老讀者,應該知道我們在過去半年一直在更新 AI 圖片出海洞察系列,Krea 是我們覺得在一眾圖片編輯產品中,有自身獨特定位和特色的一個產品。
12 月圖片編輯(上)/生成(下)產品的人均訪問次數和人均訪問時長數據,注:Krea 功能覆蓋圖片生成、修改、與增強,很難單純的將其分類到生圖/修圖類別,所以這里我們分別與修圖和生圖產品進行對比|白鯨出海制圖
從人均訪問次數和時長的角度看,Krea 的數據還是不錯的,表明獲得了一些用戶的認可。但從流量的角度,一款口碑還可以、使用數據也不錯的產品,卻一直橫盤狀態,甚至在 2024 年下半年一直下滑。
直到 1 月份,Krea 頻繁更新,上線了實時 3D 生成和快速定制化訓練 Avatar,2 個比較破圈的功能,其流量在 1 月轉好。
這其中的原因,與 Krea 相對獨特的使用體驗所吸引到的大多是偏專業的用戶有關(下文會詳細解釋),在流量下滑的情況下,Krea 嘗試破圈尋找增量用戶。Krea 的創始人 Victor Perez 也在一個播客中表示:“目前 Krea 的用戶中專業人士占比很高,但就團隊的計劃而言,則更希望去做真正面向普通人的 AI 工具。”
秉持著這個理念,Krea 的產品設計與迭代方向,一直致力于簡化操作、優化用戶的交互體驗,以吸引更多元的用戶,引入 DeepSeek 驅動的 Krea Chat,其實也是這一思路的延續。
靠實時生圖解決“可控性”問題,Krea 賺到了“第一波用戶”
Krea 成立于 2022 年,創始人 Victor Perez 從創業孵化器 HF0,獲得了數百萬美元的初期投資,并創立了 Krea。(注:HF0 是位于舊金山的一個創業孵化器,他們會為創業者提供一個為期 12 周的封閉工作空間,并視創始人在這期間的表現,為創業項目提供投資,額度超100萬美元以,上不封頂,占有初創公司 5%的股權。)
Krea 自己本身并沒有自研模型,走的是“開源模型+優化工程&UI”的路徑,結合筆者的體驗和創始人分享,Krea 的核心差異點是“精準控制”,而為了實現精準控制,Krea 著重在交互優化上下了功夫,而目前主打的實時生圖功能,就很能體現這一思路。
Krea 落地頁
Krea 于 2023 年初開始封閉測試,實時生圖功能也誕生于封測時期。根據創始人 Victor 的分享,實時生圖的靈感來源于“投屏”,他想到,在用戶生成圖片時,可以將結果實時顯示出來,然后再讓用戶照著結果,進一步與 AI 進行交互,形成獨特的用戶體驗”。
一位 Krea 的投資者的陳述|圖片來源:YC
隨后,他用了一夜時間寫好了 Demo,并將測試視頻發在了 Twitter 上,很多用戶表示非常感興趣,并希望試用這個程序。用戶的反饋讓 Victor 信心倍增,經過幾個月的開發,當 2023 年 11 月 Krea 正式上線時,實時生成功能成了主打功能。一位 Krea 的投資人表示,他就是看中了 Krea 低延遲的實時生圖,才投資了 Krea。
圖片來源:AI 產品榜(2023 年 12 月)
在推出實時生圖功能 1 個月后,2023 年 12 月,Krea 的網站流量就增長了 191%,達到了 365 萬,下一個月(2024.1)訪問量又提升了 22%,接近 450 萬。
注 1:我在這里選擇的一張參考背景,但很多創作者會選擇直接在黑色背景上進行創作,注 2:如果上傳參考圖片或者風格,Krea 中會出現了權重控制,是一個 0-1 的浮點數值,數值越接近 1,最終輸出會與參考圖像/風格越接近。
實時生圖界面中,畫布被分成了兩部分,左邊是創作區,右邊是成品區,用戶在下方輸入 Prompt,初版的圖像就顯示在右側了。除了 Prompt 外,用戶可以上傳參考圖片,選擇預設風格(官方和社區訓練好的 Lora)來控制生圖效果,并調節各個風格/圖像的“權重”,以更精準地控制輸出。(Krea 的文生圖功能也有類似的設計)
通過圖形和涂鴉,可以控制畫面中重要物體的形狀、位置、顏色,注:AI Strength 越高,AI 創作的權重越大,越低,則更忠實于用戶繪制的內容
隨后,用戶可以在左側的創作區“手繪”涂鴉或插入圖形(矩形、三角形和圓形),來控制畫面中人物或物體的位置和形狀,并通過調整 AI Strength 參數來平衡自己的“創作”和 AI 的“發揮” ,所有改動都會實時顯示在右側。
根據 Krea 創始人給出的數據,實時顯示的延遲大概在 40 毫秒左右,當用戶拖動圖形時,Krea 也會以每秒 4-5 幀(相當于 250 毫秒左右處理一張圖像)的速度連續處理圖像。創始人解釋道,實時生圖本來對算力的要求就很高,如果算上高并發,需要的算力儲備就更大了,40 毫秒的延遲,用戶既不會感到特別卡頓,還能盡量節省算力。
一位自稱是 Krea 員工的 Reddit用戶的分享|圖片來源:Reddit
在工程方面,Krea 堅持自己部署模型,以減少使用第三方托管平臺帶來的延遲,團隊也花了大量時間圍繞算力、模型等基礎設施進行了開發與優化,讓 Krea 在更大用戶量的情況下,也能維持低延遲。
而在用戶完成一版設計之后,還可以把右側的“成品圖”拖動到左邊,并以這版圖像作為基礎,進一步進行修改和優化,實現多次迭代。與 Krea Chat 相似,實時生圖也算是文生圖功能的變種和延伸,用戶通過圖形、涂鴉來精準地按自己意愿修改圖像,并可以多次迭代,以減少生圖模型不可控性的影響,相比無限抽卡,這種模式看上去更有效率。
但相比 Krea Chat,讓用戶通過圖形和涂鴉去控制生圖效果的門檻其實不低,無論是筆者本人,還是試用過 Krea 的編輯部同事都有相同的感覺,“知道這個實時生圖功能很好,但就是不知道它對自己來說能做什么用。”
從數據來看,到 2024 年 2 月(實時生圖上線 3 個月后),Krea 的訪問量已經突破了 600 萬,相當于過去一年時間,Krea 的訪問量都沒有突破這個“天花板”。
為專業用戶打造完整工作流的 Krea,能吸引普通用戶嗎?
Krea 落地頁
除了上面介紹的實時生圖和 Krea Chat 功能外,Krea 提供文生圖、改圖、圖像增強等圖像功能。此外,還給到了一個生成視頻的功能,這個功能于 2024 年 5 月推出,現已接入了混元、Runway、Kling、Hailuo 等市面上主流的視頻生成模型。
文生圖(上)、改圖(中),圖像增強(下)|圖片來源:Krea
從生圖、改圖到圖像增強,Krea 基本形成了一個較為完整的工作流。整體體驗下來,這幾項功能的效果是很在線的。而延續整體思路,基于優秀交互的精準控制,Krea 在交互也下了功夫,這些功能的操作都是比較簡便的。
用戶可以直接在畫面中框選,并輸入 Prompt,就可以在局部添加物體或修改圖像
社媒上的用戶對 Krea 優化“精準控制”的思路,絕大多數都是報以好評的,這與我們之前的認知一致,作為 Krea 初期吸引到的專業用戶,“可控性”是剛需,而 Krea 也回應了這個需求。從在 X 中與 Krea 官號和創始人 Victor 互動的用戶來觀察,Krea 目前的用戶畫像大概是藝術家、設計師、需要經常做圖的營銷人員等相對專業一些的人士。
但是對出于娛樂目的或低頻使用 AI 圖像產品的普通用戶來說,由于他們對最終的圖像并沒有具像化的認知,所以實時生圖提供的“可控性”可能吸引力不大,這大概就是 Krea 近半年來很難“破圈”的原因。
但反觀 Krea Chat,不論是引入 DeepSeek-R1,以更好地理解用戶意圖,還是通過標簽,讓用戶能夠一鍵下達準確的“改圖”指令,其實都是在回應普通用戶,對簡便操作、靈感指引和改圖智能程度的需求。而推出 Krea Chat 之后,這款產品能否破圈,找到新的用戶增長點,還需要觀察他們后續的流量表現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.