01 用戶行為分析
我曾經一度沉迷于用戶行為分析,因為它背后對用戶需求和行為的洞察是一件特別有趣的事。產品經理們常提及用戶需求和價值,這固然重要,但它們最終都離不開定量研究的支撐。若一個用戶需求脫離了發生頻次、行為強度以及可替代性,那便是無根之木。
所以在某個周期內,我會把行為采集做得特別精細化。用戶進入了A頁面,然后點擊了相關推薦,進而瀏覽B、C、D,我會嘗試用source page的邏輯將其串聯起來,并且輔以桑基圖。
類似的場景數不勝數,這類User Journey的分析確實帶來過收益,但也增加了數據采集和設計的負擔。不止一次研發同學向我抱怨。
再后來,隨著業務量的擴張,采集的數據進一步膨脹,包括歷史版本的存量積累,導致計算和存儲的開銷成本達到一個夸張的地步。我們花費了特別多的時間治理。
在治理的過程中,發現了大量歷史設計過,但實際使用為0的埋點。屬于數據的屎山代碼。光硬件成本就是數百萬/月。那一刻你才會對數據采集的冗余度有充分了解。
回過頭再看過往的分析,就會發現好的分析都是簡練有美感的,而不是堆疊了多少圖表。這時候你才會想明白,什么是「基于分析目標與假設設計數據」,什么是去蕪存菁。
回到分析本身,新用戶引導是一個繞不過的經典課題,每位產品經理都躍躍欲試。因為它具備比較大的策略迭代空間。最近看了一篇流傳甚廣的文章,說新用戶引導毫無作用。
雖然我常開玩笑說,每年都會有一些新用戶引導的嘗試和迭代被翻來覆去地寫入OKR,如有年度查重的邏輯,估計重復率挺高的。
挺能理解的,畢竟我自己就在新用戶引導上做出過收益,還不止一次,笑。這不是說,新用戶引導就是萬能大招,可以和推薦pk效率,實際的判斷,是要結合當下業務的邏輯。它有效,還是無效,是通過定量的行為數據來判斷的。
以某個海外女性社區的產品為例,在MVP階段,產品內的內容都是美妝、護膚、穿搭等。即使個性化推薦也上線,社區消費的表現仍舊一般。我做的策略是在冷啟動的階段,增加垂類引導,次留帶來4~5%的絕對值收益。
具體的數據我忘了,當然記得我也不會說,但大致的分析邏輯如下:
1.海外女性的偏好比較多元,不同膚色的用戶偏好不同的美妝;
2.即使同在護膚領域,用戶在點擊行為上也有離散性,有不同的功效偏好。干皮和油皮的點擊天然就會隔離開;
3.護膚是連續的周期行為,會在多日內反復消費;
接下來我們細拆拆解行為,關注用戶的搜索詞,即新用戶進入App是否馬上發起搜索,以及具體搜索了什么。對新用戶來說,如果首屏冷啟動的內容不滿足需求,那么她們很可能主動尋求。此時會關注冷啟的內容和搜索query的相似度,用戶實際想要的和我們提供的是否一致。
結論是不一致,進一步確認了初期的業務假設。同時搜索query的長尾詞也足夠多,說明需求是離散的。
美妝和護膚,護膚內的偏好又不一樣,同一個偏好下又有品牌、功效的不同。說明用戶的需求是足夠精細的,而在短時間內,我們無法承接好這類需求。因此,通過分析報告,我們判斷需要做新用戶引導,快速聚攏用戶的需求。
即使能承接好需求,我們產品還是缺一個獨特的hook,因為在女性賽道,同類的產品和內容足夠多了。我們的供給側沒有顯著優勢,當時在抽case的時候,發現用戶有測評的習慣,包括創作端的發布數據也發現有不少用戶會分享自己的膚質,具備討論熱度。
所以在強化引導的過程中,我們將業務邏輯封裝成了護膚管理工具,女性用戶可以通過一個簡易的工具測評膚質,獲得相關的標簽可以直接優化推薦,例如干皮就不用推油皮的內容,提升用戶對產品專業價值的感知。
最后feature上線,次留顯著提升。當然,它還需要搭配其他策略,比如投流;再比如,通過皮膚管理工具,引導女性用戶養成定期記錄的習慣,提升粘性。
在一個垂直社區,初期少量的內容無法承接精細的推薦,新用戶引導是有作用的。好比體育類目,喜歡足球的不一定喜歡籃球,喜歡梅西的不一定喜歡C羅。在這個層面做精細是沒問題的。但是對一個大型內容平臺而言,生態開始泛化,推薦效率提升,而興趣選擇因為數量太多了導致邊際效益遞減時,引導的效果就會弱化。
新用戶引導是否有用,這是一個trade off的問題,選擇的效率 vs 推薦的效率,它沒有一個絕對的答案。但定量分析有。
上文探討了用戶行為分析的基本邏輯,其中用到的數據并不復雜,例如item_click、search_click等。相信你也能通過分析案例反推出參數結構,user_id、action_type、item_id,request_id。這些都是在枚舉各類場景的埋點設計后,進而用于分析你所關注的內容的關鍵。
如何設計好你想要的數據。這是一個發散后再剪枝的基本功。
到這里為止,是曾經的草稿,我想寫,但一直沒有寫完的內容。原本的內容挺豐富的,包含各類工具的炫技,現階段我覺得不必要。因為工具和技巧,會結合下面分享的大模型心得。
02LLM x 數據采集
通過上文的案例,你應該已清楚,采集數據是為了用以分析。數據從哪里來,數據到哪里去,如果「到哪里去」不清晰,那么哪里來就容易變得盲目。
我們這里從網絡尋找一個產品設計原型圖。
當你第一眼看到購買詳情頁,你會怎么思考它的埋點?
如果你還是一位數據分析的新人,不妨結合我上一篇的文章,學習和吸收后進行實踐。接下來我們使用AI,我將盡量還原我的演示過程。
上述的Prompt,有分析經驗的話稍加練習足夠寫出來,它是很具象化的數據分析/數據科學的know-how沉淀,我也沒有用few-shot。接下來是LLM的輸出:
通過截圖,我們能看到LLM已經能夠覆蓋基本的采集場景。雖然有不夠優秀的地方,比如item_action_click過于通用,share和favorite最好不要合并(畢竟產品邏輯可能會發生變化)。
但當前的模型智能已經能讀懂產品邏輯,并識別頁面上所有的元素,包括容易被忽略的搜索評論輸入框,點擊評論(藍色可點擊狀態)進入到評論詳情頁的交互等。
如果你熟悉RAG活知識庫,那么埋點的字段規范和參數規范可以進一步精確約束。
以上的案例,我使用的是Gemini 2.5 Flash,還不是更聰明的Pro版本。
接下來,我們再用一段新的Prompt,讓它基于產品設計原型圖,先思考分析邏輯,然后再展開數據鏈路的工作:業務邏輯-分析框架-數據指標-數據埋點-數據建設,這本身就是一個清晰的ToDo List。
接下來是輸出結果(埋點的篇幅我就略過了,沒有特別大的差異,多出了一個評論停留時長的計算):
以上是分析目標、業務邏輯、量化因素、指標設計和建設的基本流程。這里暫時不對分析的好壞做評價,因為多輪對話可以修正邏輯。AI完成這類工作的效率已經足夠快,原本半天的設計工作,可以大幅度壓縮到分鐘級完善。
本次演示,我沒有用到復雜的Prompt/Tool,鑒于當前通用Agent如雨后春筍般冒出,我也不打算使用哪家來背書,僅僅是展示一下最基本的能力能夠做到哪一步。
回想當年的課程內容花費了很多時間,現在有一半需要重構了,哈哈。
回到故事的第一個新用戶引導案例,它是通過大量的行為數據推導得出的假設——女性用戶在護膚場景需求是離散的,且初期的社區需要精細化的滿足?,F在的大模型或許難以完成這種梳理并提出優質假設,但如果你的假設足夠solid
,那么后續的證明過程效率會提升幾何倍呢?
我不想過于強調AI的優點或缺點,當它出現并且改變你的工作形式時,原有的初級-中級-高級-專家的學習范式就被改變了。即使埋點是重復性勞作,其背后的分析思路AI一時半會還學不會,但基礎工作的生產力關系已經發生變化。
曾經在朋友圈看到一句話,在Flux和SD的文生圖模型問世時,設計師朋友大感震撼,大家在設計峰會熱烈討論。然后實際情況是,100個設計師只有一半安裝了ComfyUI,五分之一簡單適用了ControlNet,最終只有兩個人用Lora煉丹(然后kontext出來了)。
之前我寫「七周」的時候,有人質疑,七周到底能不能學會?八年后的今天,純粹使用工具的門檻已經大幅度降低,在human in the loop的模式下,你現在的學習需要幾周?你又應該學習哪些?
產品PRD是最基本的業務單元,設想一下整個workflow的邏輯:輸入PRD的文檔(當前的上下文窗口足夠理解),輸出思路、指標、埋點、實驗、ETL。每一個步驟可能只會做到80分,但是剩余的20分,又需要分析師花費多少時間呢?
這幾年,我一直想著,是否將以前的公眾號內容完善(不騙你)。既有新學習的心得和體會,也有完美主義的強迫癥作祟。這下剛好,新的技術給了新的契機。
內容的更新,依舊是免費的分享。至于是否還需要教你Python、SQL和Excel和統計學?我認為是不必要的。
仔細想了想,如果你想鍛煉量化/數據/分析的能力,那么往后可能是:
1.具備出色的設計數據workflow的能力,調度和統籌Agent,解決80%的標準場景。
2.AI Coding作為直接的生產力工具(我不會展開說第三方Agent,企業的數據是閉源的),解決20%的非標準化場景,基于Data的Coding會是主流。
3.提出優秀的業務邏輯和假設,證明和研究它。
來源 | 秦路(ID:tracykanc)
作者 | 秦路 ; 編輯 | 荔枝
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.