在廣告展示數一定的條件下,點擊率的高低就是決定一個廣告能否被更多人看到的因素。 文章主要分析就針對“點擊率”這一因素進行分析,與大家分享。
一、分析背景及目的
數據源:Ad Display/Click Data on Taobao.com 這是一份淘寶平台的廣告展示/點擊數據,本次分析需要從這些數據中發現某些規律或者異常,進而給運營團隊提出建議 評價一個廣告效果的指標就是廣告的點擊人數,可以反映一個廣告有多少人願意點擊查看廣告的內容,只有廣告被點擊,後續轉化為購買行為才會發生。
把廣告的點擊人數指標拆分:廣告點擊人數=廣告展示數 x 點擊率,而廣告展示數又由廣告商品的價格、類別影響;不同人羣對不同類別商品有着不同的喜好,從而影響廣告的點擊率。
在廣告展示數一定的條件下,點擊率的高低就是決定一個廣告能否被更多人看到的因素。 因此本次分析就針對【點擊率】這一因素進行分析。
二、分析思路
從“廣告”和“用户”兩個角度進行分析:
1. 廣告角度
2. 用户角度
三、分析過程
1. 數據清洗
(1)數據概覽
原始的數據集中包括三類數據,具體數據對應屬性如下:
為了方便分析,抽取其中的部分字段作為分析。 從raw_sample數據集中抽取:用户ID、廣告ID、是否點擊 從ad_feature數據集中抽取:廣告ID、類目ID、廣告商品價格 從user_profile數據集中抽取:用户ID、年齡層、性別、購物層次
(2)數據組合
將三張數據表,組合到一張表中
得到一張記錄了用户-廣告信息表
(3)缺失值處理
1)源數據中還有許多的缺失值,將性別和年齡層字段中為空值的記錄刪去
2)查看數據中的異常值,並將異常值刪去 查看廣告商品價格字段的屬性值範圍:
發現最大值為100000000.0元,價格過大,屬於異常值,刪去 再次查看價格字段的屬性值範圍:
還是存在數據值過大的異常值 為了方便分析對價格字段進行切分,選取更貼近日常生活的價格在1000元以內的廣告記錄進行分析 切片之後仍保留了751570條記錄
(4)數據字段整合
對於廣告商品價格字段,每個廣告的商品都有各自的價格,根據價格字段不便於進行統計。新增一個字段“price_class”代表價格的區間。
(0-價格在0-100元、1-100-200元、2-200-300元…)
2. 結合圖表分析
(1)分析不同廣告商品價格對點擊率的影響
①將廣告商品價格分類
將廣告按價格分為100元以下、200元以下、300元以下等10類,並計算不同價格區間中廣告的點擊率情況。
從圖中發現,所有價格區間商品的點擊率都在5%左右,其中廣告商品價格在100元以下的廣告點擊率最高,為5.92%; 看到價格較低的廣告商品點擊率更高,我們一般認為是對價格敏感的淺層用户(免費用户)在這方面的點擊率更高,而擁有一定消費行為和消費意識的中層、深層用户(付費用户)則更在意購物時的體驗以及商品的質量。 為了驗證以上説法,我們先假設100元以內的廣告商品主要的點擊對象是淺層用户,再通過數據驗證。
② 分析100元以內廣告商品點擊率的用户組成
查看點擊了100元以內的廣告商品的用户的用户組成
從用户分佈可以看出,在點擊了100元以內廣告商品的用户中,深度用户的比例更高,佔比81.6%,而淺層用户的佔比則相對少很多。這推翻了我們原來的假設。
小結:
(2)分析哪些類別的廣告點擊率更高,哪些類別的點擊率低
由於廣告的類別數量眾多,大部分類別的廣告只有1-2次的展示,數據樣本太小,因此選取展示數量最多的7個類別進行分析。
① 找出展示數、點擊數、點擊率最高的廣告類別
可以看出類別6261廣告的展示數、點擊數、點擊率均為最高,而類別4385廣告的展示數雖然有10000 ,但是點擊數、點擊率卻是最低的。
② 分析類別4385廣告效果最差的原因:
a.先按【廣告商品價格】來分析
計算沒有被點擊的類別4385廣告的商品的平均價格
而點擊了類別4385廣告的商品的平均價格為:
兩者平均價格都在200-300區間、差異不大。結合分析(1),價格區間在200-300的廣告商品點擊率平均是在5.29%,而類別4385則只有3.61%。 這説明:廣告商品價格不是影響類別4385廣告點擊率的因素
b.再按【性別】來分析
先來看看類別4385被哪些用户看到了
可以看出,類別4385的廣告,主要是被推薦給了男性用户,而男性用户對這類商品的興趣大於女性。 並且女性對這類商品的廣告興趣不高,點擊率只有2.75%,是造成類別4385廣告點擊率低的主要原因。
c.最後按【用户年齡】來分析
來看看不同年齡段、不同性別的用户點擊率有什麼差異
(年齡字段含義:0:10歲以下、1:10-20歲、2:20-30歲、3:30-40歲、4:40-50歲、5:50-60歲、6:60歲以上)
從統計的數據可以看出,類別4385廣告的商品主要點擊羣體是30歲以上男性用户,尤其是60歲以上男性興趣最高,而女性用户對這類廣告商品興趣低。結合a、b的分析,受30歲以上男性歡迎、價格在200-300的商品,推測是西裝、皮鞋類或者煙酒類又或者是家用電器類商品
③ 小結
(3)分析性別和廣告點擊率有什麼關係
① 計算男女人數比例
男女比例約為:1:1.6
② 計算男女各自的點擊數
男女廣告點擊數的比例約為:1:1.7 因此,總體上女性的點擊數要多於男性,但兩者的點擊率基本一致。
③ 比較各類別廣告點擊率-男女差異
可以看出,大部分類別中,女性的廣告點擊數都要明顯大於男性的點擊人數。 只有類別4385、類別4505,這兩個類別的廣告,男性的點擊人數要超過女性的點擊人數。 男女之間的主要差異是由類型6261的廣告造成的,女性的點擊數大約是男性的4倍。
④ 小結
(4)分析用户羣體對廣告點擊率有什麼關係
不同的用户羣體之間用户價值與消費習慣具有一定的差異,對於不同用户羣體的廣告投放的策略也不同。通過分析不同用户羣體對廣告點擊率有什麼關係,來制定不同的投放策略。
這裏的分析通過K-Means算法來對用户進行聚類,並基於RFM模型來對用户價值進行劃分。
①用K-Means算法對用户進行聚類
這裏選取用户的購物層次、廣告點擊率、瀏覽廣告的商品平均價格,這3個指標來作為判斷用户價值的標準
對用户進行聚類分析:
這裏將所有用户分成5類,來代表用户價值的高低。
注:三個特徵在聚類時都進行了特徵的標準化
從不同羣體的特徵分佈可以得出:
因此,我們可以出:羣體5對廣告的接受程度最高,非常願意點擊廣告。羣體2更喜好高價格的商品,對購買高價商品抱有極大興趣。
② 用RFM模型對用户進行劃分
根據用户在購物深度、點擊率、觀看廣告商品的平均價格3個維度的表現,將用户劃分為5類客户。
1)重要保持用户
2)重要發展用户
3)重要挽留用户
4)一般用户
5)低價值用户
根據聚類結果,對應上述五類客户類型,進行匹配,得到客户羣體的價值排名:
根據結果,我們可以發現5類用户的分佈如圖所示:
可以看出:最有價值的3類用户佔比約為20%。這20%的用户必然貢獻了廣告點擊率的絕大部分,平台如果希望廣告效果好,就需要投入資源服務好這部分用户 一般用户、低價值用户仍為平台用户的主體,對於這類用户需要通過運營/營銷策略,提高他們的活躍度/點擊率,爭取將他們轉換成重要的用户。