數據分析,用對圖表很重要

數據分析是互聯網產品極其重要的一個環節,目前整個互聯網行業的發展逐漸趨於理性了,從好些年前的“增量市場”變為“存量市場”,很大的一個特徵就是獲客成本變高了,流量越來越珍貴。在這種行業背景下,數據分析成為了一手利器,可以推動產品設計與運營環節,列舉幾個典型的場景:

產品經理在規劃新版本時,如何制定相關的數據指標來驗證?

功能上線後,如何就採集到的數據,進行數據覆盤,判斷新功能是否達到團隊預期?

如何通過數據瞭解產品目前的問題以及分析背後的原因?

運營人員在完成一個活動後,如何通過數據來評估本次活動的效果?

如何將冰冷的數據通過直觀的可視化圖表向上級進行彙報?

在產品設計的時候涉及到數據可視化統計的界面,如何選擇核心指標以及合適的可視化圖表?

........

以上只是數據分析應用的其中一部分場景,實際上還有很多。有些人可能會認為,數據分析那是數據產品經理的職責,其實不然,我認為數據分析重在思維,是一種通過現象看本質的思維,這種思維能力是產品經理需要掌握的,不少企業在招聘產品經理的時候也會看重產品經理的數據驅動能力。

數據本身冰冷沒有意義的,我們需要通可視化圖表將數據直觀的表現出來,然後對其進行分析,發現背後藴藏的規律。

數據可視化圖表的類型十分豐富,此處不一一列舉,本篇文章主要跟大家分享幾種比較簡單、常見的數據分析可視化圖表以及使用場景。如果簡單的圖表可以解決問題,為什麼還要花裏胡哨呢?

一、常用的可視化圖表

常用的可視化圖表包括:餅圖、柱形圖、條形圖、折線圖、散點圖,這五類圖表可以滿足我們工作中大部分的數據展現與分析需求,簡單的圖表往往能夠有效、形象、快速地傳達信息。

這時候你再回想一下,你在日常工作中見到的圖表是不是基本上都是以下幾種類型。

數據分析,用對圖表很重要

基本的可視化圖表

以上五類圖表是最為基本的可視化圖表,它們還能夠衍生出其他稍微複雜些的圖表,比如柱形圖還包括簇狀柱形圖、堆積柱形圖、百分比柱形圖。

EXCEL表對以上圖表進行了比較好的分類與歸納,有興趣做進一步瞭解的朋友可以打開你的EXCEL表,在插入圖表功能中可以看到。

數據分析,用對圖表很重要

二、通過數據間的關係選擇圖表

常見的數據關係包括:成分、排序、時間序列、頻率分佈、相關性、多重數據比較。

1.成分

成分也稱構成,主要關注每個部分佔整體的百分比關係。適用的圖表有餅圖、柱形圖、條形圖、瀑布圖。

數據分析,用對圖表很重要

1)餅圖

如果僅需要關注單個整體的各部分比例構成,則首選餅圖。餅圖的分類不建議超過9個,可以把剩餘次要的部分歸類到“其它”項中。

餅圖在數據分析中是比較常用的一種圖表,比如用户來源渠道佔比、各終端GMV貢獻佔比等都可以使用餅圖。

2)柱形圖

當需要對比多個項目之間的成分構成,且項目的個數不多時,我們可以用百分比堆積柱形圖。

數據分析,用對圖表很重要

通過上圖,我們縱向看出六大地區的銷售額構成,也可以橫向做對比。

為什麼不繼續使用餅狀圖呢?大家可以想象一下,如果我使用6個餅狀圖來向你傳達6個地區按客户類型銷售額佔比,你還有那個耐心看下去嗎?

3)條形圖

其實條形圖跟柱形圖兩者最主要的差異並不在於統計分析,而是在於數據展示的可讀性。

當項目個數較多,名稱較長時,可優先選擇條形圖,因為條形圖能夠橫向佈局,方便展示較長的項目名稱。

在產品設計中,橫向佈局的條形圖更能節省頁面空間,且可以通過適當加大橫座標的長度來體現類目之間的差異性,這也是考慮使用條形圖的一個場景。

所以,當需要對比多個項目之間的成分構成,且項目的個數比較多,項目名稱較長時,可以用百分比堆積條形圖來表示部分與整體之間的組成關係。

數據分析,用對圖表很重要

某校教師對學生在各方面表現的評價情況

關於瀑布圖,我就不在這裏展開介紹了,我自己使用的比較少,有興趣的朋友可以自行百度瞭解。

2.對比

指不同項目間數據的比較。在對比的過程中會遇到如何排序問題,可以根據數值大小升序或者降序,也可以根據分析的主題來考慮使用什麼排序。適用的圖表主要有柱形圖、條形圖。

數據分析,用對圖表很重要

1)普通柱形圖、條形圖

當對比的項目由單一成分構成時,使用普通的柱形圖或者條形圖即可,比如銷售額按地域進行對比、銷量按商品品類進行對比、Top排序等。

普通柱形圖

普通條形圖

2)堆積柱形圖、堆積條形圖

當對比的項目由多個部分構成時,可使用堆積柱形圖或者堆積條形圖。可以比較清楚的看出各個項目的總數值大小以各項目內部的構成。

數據分析,用對圖表很重要

堆積柱形圖

數據分析,用對圖表很重要

堆積條形圖

3.時間序列

時間序列用於表示某事物按一定的時間順序發展的趨勢、走勢,是上漲、下降、上下浮動還是基本穩定。適用的圖表有折線圖、柱形圖、面積圖。

1)折線圖

折線圖是最常用的表達事物隨時間發展趨勢的可視化圖表,當時間序列的時間點比較多時,建議使用折線圖。

如果大家有留意新冠疫情的動態統計,就會發現大家都是用折線圖來展示疫情的發展趨勢,我們通過一條曲線就可以很直觀地瞭解疫情的動態。

下面舉一個某小程序近30天變化趨勢展示。

某小程序GMV近30天變化趨勢

2)柱形圖

有些人可能問到,折線圖跟柱形圖都能夠表達時間序列的發展趨勢,那什麼情況下可以使用柱形圖呢?

數據分析,用對圖表很重要

某平台過去7天活躍用户數趨勢

從上圖你可以看出,活躍用户在8月15號達到最大值,隨後大幅度下降,呈現出比較穩定的趨勢。同時,你可以看出每天的活躍用户構成情況,三大運營商的用户數沒有比較大的差異。

3)面積圖

當然,我們也可以用面積圖來表示時間序列的發展趨勢。面積圖其實是折線圖的演變,折線圖下方填充陰影,就構成了面積圖。

但是面積圖有個缺點,就是當數據指標大於1個時,各數據指標之間可能會出現相互遮擋的情況,會影響趨勢的展示,建議統計的指標類型不要太多。

由普通折線圖演變而來的面積圖

下圖表示某物流平台在第一大區近四年的收入趨勢。

數據分析,用對圖表很重要

堆積面積圖

再比如,下圖表示的是8月15到8月21號某電商平台的訂單總量,的變化趨勢。

堆積面積圖

在介紹上面幾種可視化圖表時,多次提到了堆積類型的圖表,包括堆積柱形圖、堆積條形圖、堆積面積圖,它們都是由多個部分累加得來的,最後組成一個整體。

以上圖為例,2015年第一大區的總收入是39,分別由中山、東莞、廣州、深圳在2015年的收入累計組成。

4.頻率分佈

頻率分佈可以比較清楚顯示各組頻次分佈情況與差別。

當然,這一類比較也可以用頻數分佈表示,只是單位不同。比較典型的案例有班級學生的身高分佈情況。適用的圖表有柱形圖、條形圖、折線圖。

數據分析,用對圖表很重要

利用頻率分佈,可以幫助我們對某些產品數據進行分析,比如統計用户在某一天內進行詳情頁瀏覽的次數分佈、統計過去7天用户的購買頻次分佈情況。

1)柱形圖

柱形圖是比較常見的表示頻率分佈的圖表,一般情況下,當表示分組較少的頻率分佈時,可以考慮使用柱形圖。

某平台過去7天用户的購買頻次分佈

2)條形圖

如果分組比較多、名稱較長的,可以考慮使用條形圖。

3)折線圖

折線圖也可以用於表示頻率分佈,如果分組比較多,希望看到數據的波動情況,可以選擇折線圖。

5.相關性

相關性用於衡量X與Y的關係,比如銷量與價格之間的關係、訪問量與瀏覽量的關係等。

最為常用的圖表有散點圖、氣泡圖。另外對稱條形圖、柱形圖也可表示相關性,不過感覺見得比較少,所以在這裏不做介紹,有興趣的朋友可自行了解。

數據分析,用對圖表很重要

1)散點圖

散點圖表示因變量隨自變量而變化的大致趨勢,通過散點圖,我們還可以看出各個點在座標軸上的分佈情況。

當只有兩個變量X跟Y時,可用散點圖觀察兩個變量之間的關係。

從上圖可以看出,轉化率和綜合瀏覽量兩者之間是呈正相關的關係。

2)氣泡圖

散點圖一般研究的是兩個變量之間的關係,但有時候我們的分析需要涉及到第三個變量,氣泡圖就是在散點圖的基礎上衍生而來的,用來表示三個變量之間的關係。

當存在第三變量,即X、Y、Z時,我們可以使用氣泡圖進行分析,點的大小或者顏色可以定義為第三個變量。

數據分析,用對圖表很重要

如上圖,用圓點大小來表示訪問次數的多少,可以看到訪問次數最多的那天,轉化率和平均綜合瀏覽量都不高。

6.多重數據對比

多重數據對比指數據類多於2個,且每個數據類擁有多個維度的數據分析比較。我們可以用雷達圖來表示。

如下圖,比較中興Grand S 與索尼L36h 兩款產品分別在牌照、硬件、價格、屏幕、系統5個維度中的評分情況。

數據分析,用對圖表很重要

最後,呈上一張總結圖

數據分析,用對圖表很重要

常用圖表類型與作用

三、寫在最後

數據圖表遠遠不止本篇文章提到的那些,以上是基於自己的經驗以及網上的資料總結而來,主要的目的在於幫助大家瞭解常用的圖表以及如何選擇合適的圖表,如有紕漏的地方,敬請指出。

數據分析的目的在於發現問題、解決問題,需要根據分析的主題、數據之間的關係選擇合適的圖表,如果簡單的圖表可以解決問題,實在沒有必要執着於複雜,常人不易理解的可視化圖表。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 3451 字。

轉載請註明: 數據分析,用對圖表很重要 - 楠木軒