楠木軒

數據分析三大手法之“細分分析”

由 仝海燕 發佈於 財經

作為業務部門的數據分析師,經常面臨的場景就是分析異常。

比如老闆找到你説:“小夥,幫我分析下最近一週的GMV下降的原因。”很多人拿到這個問題的時候就開始直接去找各個維度來拆分看了,最後還是一臉茫然。

首先拿到這個問題時,我們需要用分析方法,描述和對比分析法。就是採用描述性分析方法,看具體的GMV值下降了多少,以及採用趨勢和對比的方法來判斷是不是真正的異常,有可能去年同期也是節假日後的正常下降。

這個過程就像偵探探案時瞭解一些案發現場的基礎信息。在對異常有了基礎認知之後,想要了解真相,需要細分的思維方法,一步步分解還原案發的蛛絲馬跡。但是怎麼細分,以及按照什麼樣的套路細分是有講究的。首先介紹細分常見的方法,筆者將其歸納為3類。通常在分析一個具體問題中可能會多種一起使用。

一、結構細分

第一類是按照結構進行細分:

事物或組織本身的結構;

產線的區分(如化妝品類,生鮮類等),區域的區分(如華東/華西/華南大區),渠道的區分(APP/小程序/PC端)等。

杜邦分析法,是杜邦公司發明的,採用金字塔結構,把企業淨資產收益率逐級分解為多項財務指標的比值或乘積。

這個借鑑於我們常規的指標體系的分析中。比如,在文首遇到的那個情景,GMV同比下降30%,可以按照杜邦分析法進行指標拆解,定位是UV少了,還是cr下降了,還是客單價降低主要影響。

分組分析法,根據一定標準對研究對象進行分組。

分組分析法分為屬性指標分組和數量指標分組。而屬性指標所代表的數據不能進行運算,只是説明事物的性質、特徵。如人的姓名、部門、性別、文化程度等指標,可以按照一定規則分組,比如頁面引流中對於同組織下:內部引流,其他為外部引流。

數量指標所代表的數據能夠進行加減乘除運算,説明事物的數量特徵,比如人的年齡、工資水平、企業的資產等指標,例如年齡屬性:1-17:青少年,18-35青年,35-55中年,55以上老年;

矩陣分析法,又稱四象限分析法,源自著名的BCG矩陣,多用於產品組合戰略分析中,實現產品及資源分配結構的良性循環,明星/現金牛/廋狗/問題產品。

在分析場景中,可以用來評估兩種因素對於不同組的影響差異時,識別不同組間不同的業務策略。比如,評估業務中各個大區的GMV佔比vsGMV同比增長率,識別到重點核心大區和有機會的大區。

二、時間流程

第二類是時間(流程)維度:

時間顆粒度下的細分,按年/月/周/日對齊的方式細分看異常是否集中於某一時間段。

漏斗分析法,這是互聯網用於行為分析中使用較多的分析法,分析從潛在用户到最終用户這個過程中用户數量的變化情況,確定整個流程的設計是否合理,各步驟的優劣,和是否存在優化的機會。

客户生命週期的方法,主要應用的場景是用户運營,聚焦不同階段用户運營的策略,平時接觸不多,就不展開。

三、程度屬性

第三類是程度分析方法,聚焦關注重點:

ABC分析法,又稱帕累託圖法。據事物在技術或經濟方面的主要特徵,進行分類排隊,分清重點和一般,從而有區別地確定管理方式的一種分析方法。

A類是我們重點關注的。比如可以在平台上去識別A類SKU帶來累計GMV達80%,B類和C類佔比剩餘20%,理清楚平台的重點品類。

A類因素,發生累計頻率為0%~80%,是主要影響因素。

B類因素,發生累計頻率為80%~90%,是次要影響因素。

C類因素,發生累計頻率為90%~100%,是一般影響因素。

四、應用

案例使用:在日常指標分析過程中,一般常用的是杜邦分析,結構細分和漏斗想結合的方式來定位異常點。

我們通過定位發現近期GMV的下降,首先拆解日期來看,沒有集中在哪一天有異常;

通過杜邦分析法拆解為UV*cr*客單價三個部分,定位到是轉化率cr的下將是主要影響成分。

拆解cr的過程,按照 詳情頁-填寫頁-提交訂單-支付訂單漏斗流程中去拆解發現是在填寫頁到提交訂單這個過程轉化率下降。

使用常見單維度因素去識別:平台(APP/H5/PC),主要影響是APP,產線(門票/跟團/酒店)無差異;

拆解ios/安卓系統,版本維度拆解去看是否對這個過程的影響;識別到時填寫頁驗證碼有bug導致這個步驟轉化率變低,從而識別到改進點。

以上這個案例是將平時的分析過程進行了簡化,但是方法和套路是不變的,多加練習,用好細分分析手法,拆解定位問題信手拈來。

下圖附上我整理的原因分析方法的思維導圖。