數據分析的四個層次
編輯導讀:單純的數字是沒有靈魂的,但是數據分析卻可以洞察出數據背後業務的規律。因此,數據分析是商業活動中重要的一項工作。本文將圍繞數據分析的四個層次展開介紹,希望對你有幫助。
我通常把數據理解為業務的另一個他,單純的數字是沒有靈魂的,而背後的業務卻是鮮活的。商業數據分析的核心是洞察數據背後業務的規律,本質是數據賦能。我相信從事商業分析的小夥伴們都聽説過,數據分析的三個層次:描述性分析、診斷性分析和預測性分析。
著名的諮詢公司Gartner在2013年總結、提煉出了一套數據分析的框架,如上圖所示,他們把數據分析分成了四個層次,除了剛才説到的三個之外,還有一個處方性分析。診斷出業務的問題之後,還需要結合實際情況,給出運營策略去改善它。我更傾向把處方性分析合到診斷性分析裏,因為分析和運營是需要結合在一起的。當然,這些小細節影響並不大。如今在公司0-1的參與項目,先前很多的方法論正好有機會都經歷一遍,所以想結合這些框架梳理一下自己的想法,歡迎大家留言或者進羣交流。
本篇文章先跟大家介紹一下數據分析的四個層次:描述性分析、診斷性分析、預測性分析、處方性分析。
二、描述性分析:發生了什麼?通過一些核心指標的數據和前後對比,告訴業務方(或者老闆)目前業務的現狀是怎樣的。比如常見的流量、轉化率、收入、成本等等這些指標。往往這些指標是比較宏觀和概括性的,對比完就能對整體的情況有個認知。在公司裏,大家經常會用Tableau做日報/週報,其實主要承擔的就是描述性的彙報。
關於描述性分析,需要思考幾個問題,才能讓整個日/週報概括而又具體:
首先要思考在日/週報中展示哪些業務,可以提供幾個維度去參考:
- 老闆關心哪些業務?想了解什麼信息?
- 部門負責哪些業務,重點是在推哪些?
可以沿着這個方向去確定要展示的業務。
2. 用哪些指標,如何衡量變好/變壞善用對比(環比/同比)、趨勢等比較方式,不能只展示指標的數據,還要能直觀的反映出目前狀態是好還是壞。
3. 沉澱分析框架當然,描述性彙報也需要沉澱診斷性分析的框架。比如説,在週報中展示轉化率指標,不論漲跌,大家肯定會在意是怎麼回事。而要分析這事兒,就可以按渠道進行拆解,分成APP端、PC端、小程序端的轉化率等等,分別關注一下。
所以對於該指標的框架性拆解分析,就可以沉澱在描述性彙報中,這樣指標的漲跌就立馬能定位到哪個環節的問題。定位出問題環節後,再細一步的原因就需要去找對應的業務方諮詢了。
三、診斷性分析:為什麼會發生?業務變好/變壞了,除了知道這個結果外,我們還需要通過數據進一步瞭解為什麼會這樣。
在診斷性分析中,就需要去分析業務結果和很多因素的相關性。當然,怎麼能較快速地定位到分析哪些因素和結果的關係,要基於對業務的理解。可以大家一起頭腦風暴分析業務數據,也可以去調研,或者深度訪談一些業務關鍵角色,讓他們給一些輸入,我們才可能知道從哪些維度去分析數據更合理。
1. 定性分析若分析的僅是一個特徵與結果的相關性,則可以通過畫二者的二維散點圖進行分析,通過圖形描述,可以初步且直觀判斷二者的存在何種相關關係:正相關、負相關、無關;如果相關的話,是線性相關還是非線性相關(拋物線、指數等)。
我們通過散點圖可以定性的判斷兩者是否具有相關性。定量上,我們可以通過迴歸對他們對關係做出精確的描述。
若結果為連續值,則應用的模型為迴歸模型,包括:
1)一元線性迴歸
若僅有一個特徵與結果相關,並且其是呈線性關係的,則可以進行一元線性迴歸,即建立迴歸模型y=a+bx計算出截距a和斜率b,x為特徵(自變量),y為結果(因變量)。
2)多元線性迴歸
在實際業務中,僅單個特徵與結果相關的情況是不多見的,大多數都是多特徵共同作用導致的結果。若多個特徵無多重共線性,且與結果呈線性關係,則可以進行多元線性迴歸分析,建立迴歸模型y=a+b1x1+b2x2+…+bnxn。
3)非線性迴歸
如果迴歸模型的因變量是自變量的一次以上函數形式,迴歸規律在圖形上表現為形態各異的各種曲線,稱為非線性迴歸。常見的非線性迴歸模型包括:雙曲線模型、冪函數模型、指數函數模型、對數函數模型、多項式模型等。
四、預測性分析:後續可能會發生什麼?預測性分析就是提前評估後續可能會發生什麼?在工作中的場景,經常就是利用現有數據進行測算,評估業務接下來的發展。
比如提前需要測算業務年度成本、年度目標、未來收益的大小等等。
五、處方性分析:該怎麼做?這步的分析通常是接着診斷性分析的,在我們找到了業務變化背後的原因後,我們就需要去想一些策略去改善它。
首先是要定位出業務原因。在診斷性分析這一步,我們在數據上找到了影響結果的因素,這時候就需要去在業務層面上思考原因。
比如説,為了促進用户轉化,我們發放了優惠券,但是後續發現券的使用很少,單量也沒有上升,這是數據維度的原因。
那業務層面的呢?為什麼用户都不用優惠券呢:
這時候有些猜測的原因可以通過數據來論證,而有些原因就需要去調研用户;如果是優惠券的位置不明顯,我們就需要在產品上調整;如果是優惠券的額度太小,我們就需要去適當調整優惠力度。只有準確找到了業務原因,我們才能用策略根本性地解決它。
我發現很多時候,業務原因的定位是缺失的,往往我們在發現數據原因後,我們就開始思考運營策略了,指向性也非常強,激勵(抓手)+數據維度的改變,這種做法是比較粗糙的。可能短期內有效果,但是一旦你激勵停止,業務還是會回到原來的狀態。
核心還是要找到業務改變的關鍵動作以及可以運營的業務場景,不能盲目的抓結果!
#專欄作家#大鵬,公眾號:一個數據人的自留地。人人都是產品經理專欄作家,《數據產品經理修煉手冊》作者。
本文原創發佈於人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基於CC0協議