編輯導語:對於產品來説,數據是很重要的。有了數據才能發現問題、提升留存、留住客户。那麼,我們如何才能藉助數據達成以上的目標呢?本文作者就為我們介紹瞭如何用數據賦能產品,以及通過數據去幫助產品發現留存的關鍵行為。
產品除了活躍的數據,留存的數據也是至關重要的,優化好了留存,也就提升了活躍。所以數據分析師天天會被產品問到的一個問題就是:我們到底應該怎麼去提升我們的留存。非常煩,你們有沒有這樣的感觸?
互聯網思維中的一條就是用户至上,留住用户才有故事。那麼我們怎麼通過數據去幫助產品去發現留存的關鍵行為呢,去解決我們煩心的問題呢?
我們的分析目標: 影響留存的相關的關鍵行為有哪些?這些行為和留存哪一個相關性是最大的?這些關鍵行為和留存是否存在因果關係?
二、分析思路分析思路和方法:
首先是關鍵行為的提取,這一步就是利用sql從數據倉庫中提取你想要的與留存相關的數據行為,這一步是最麻煩也是最費時間的。
利用統計學的相關性的計算方法,可以計算第一步計算的每一個行為與留存的相關性。相關性的係數越大就代表這個行為跟留存是越相關的,就代表它可能就越影響留存。
比如刷抖音的次數跟留存的相關係數是 0.6,刷抖音的時長和留存的相關係數是0.8,就可以説明刷抖音的時間。
然而數據分析中的相關關係不一定是因果關係,比如很多人喜歡張傑跟他唱歌好聽是相關的,我們不能説他唱歌好聽是大家喜歡他的原因,可能真正原因是他的顏值。
類似的,我們的這些關鍵行為也不一定是決定留存的原因,可能只是具有相關性。所以我們就要去推斷 a 是b 的原因,利用的方法是granger test因果檢驗的方法。
當我們已經判斷了XX 行為就是留存的原因,比如你一週刷抖音的時間是你下一週是否會留存的原因,那麼接下來就是去發現到底刷抖音多長時間是留存的magic number。
這個magic number 非常神奇,就是比如你一週刷抖音288分鐘,你下週留存的概率會大大增加,這個”一週* 刷 * 288分鐘” 就是互聯網中最經典的magic number。抓住了magic number,也就抓住了一個產品的留存靈魂。
三、關鍵行為特徵拿某直播app 作為例子,與留存的相關的行為可以分為:登錄行為、觀看行為、彈幕行為、付費行為,然後在每一個大的行為分類進行小的指標的刻畫。
比如去描述登錄的行為我們就可以用30天登錄天數、7天登錄天數;還可以用比率型指標,像最近30天的登錄天數和過去30天的登錄的天數的比值,這個反應了用户活躍度的變化。
四、相關性分析上一步已經提取完了所有跟留存相關的行為特徵,這一步就要進行計算留存和這些特徵的相關性。
留存相關最大的四大因素:
- 30天或者7天登錄天數(cor: 0.66)
- 30天觀看品類個數(cor: 0.44)
- 30天觀看主播數 (cor: 0.37)
- 30天日均觀看時長(cor: 0.26)
因為我們只是找出了跟留存相關的行為特徵,但我們不知道這些行為特徵是否是留存的原因,所以就要通過granger test 因果推斷的方法去驗證這些行為特徵是否是留存的原因。
兩個經濟變量X、Y之間的格蘭傑因果關係定義為:若在包含了變量X、Y的過去信息的條件下,對變量Y的預測效果要優於只單獨由Y的過去信息對Y進行的預測效果;即變量X有助於解釋變量Y的將來變化,則認為變量X是引致變量Y的格蘭傑原因。
原假設和是否拒絕:X 和 Y 是不存在因果關係,當經過格蘭傑因果檢驗後計算出來的 p 值大於0.05 則接受原假設,否則拒絕原假設。
主要結論:
六、Magic Number發現了影響留存了原因以後,我們就要尋找這些行為是達到一個怎麼樣的值以後,會大大影響留存的概率。所以我們計算了30天登錄天數、7天登錄天數、月日均觀看時長、30天觀看主播數、30天觀看品類數和留存的關係。
下面是畫出來的圖:
拿30天登錄天數作為例子:橫軸就是30天內不同登錄天數,縱軸就是留存率;當橫軸為7的時候,留存率趨於穩定,這時候就達到較穩定的狀態也被稱作 aha moment.
我們可以發現幾個神奇的magic number:
- 月登錄4天
- 周登錄三天
- 月觀看7個主播數
- 月觀看4個品類數
- 月日均觀看時長4分鐘
本文由 @陳友洋 原創發佈於人人都是產品經理。未經作者許可,禁止轉載。
題圖來自 Pexels,基於CC0協議。