編輯導語:AB測試這項技術最早被應用於美國的網際網路市場,進入國內市場也不過6、7年時間。2000年左右,以谷歌為首的網際網路企業開始採用AB測試的方法,運用資料幫助企業做決策管理,降低試錯成本,促進業務增長。2010年以後,AB測試開始出現產品化的趨勢,併成為企業決策的一項重要工具。
今天和大家分享一下關於AB測試的基礎知識。
一、AB測試是什麼網際網路行業變化很快,很多產品的迭代速度都是按周甚至是按天來的。無論是產品的最佳化方向,還是決策的制定,都需要有資料來說話。
目前,大部分產品迭代的方式,是直接將某版本釋出給全部使用者。一旦遇到線上BUG或者資料效果不好,就不得不緊急修復或者功能最佳化,有時甚至需要回滾到前一版本。
這對使用者體驗、專案進度影響是很大的,如何能解決這個問題呢?
AB測試能很好的避免這個問題。所謂AB測試,就是在正式發版上線前,將使用者流量對應分成幾組,讓使用者分別看到不同的方案設計,根據幾組使用者的真實資料反饋,進行資料效果的校驗。
如果新版本資料呈現沒問題,再考慮將新版本向全量放開,從而可以有效減少線上全使用者發生事故的機率,提升使用者體驗。簡單理解,其實就是初中學的對照試驗。一組是對照組,一組是實驗組。
哪些場景比較適合進行AB測試呢?
二、AB測試的應用場景AB測試通常用在以下幾個場景:
1. UI的最佳化這是比較常見的場景。
不像功能的設計,存在著很多邏輯上的思路,經常還是可以確定哪種方案好,哪種方案不好。UI的最佳化,往往是很“藝術”層面的。往往看到真實資料前,誰也難以說明哪種設計能帶來更好的資料效果。如下圖:
上圖就是一個顏色的變化,這種情況下比較適合透過AB測試完成最終方案的確定。
2. 文案變化這個其實和UI層面的最佳化很類似。同一個按鈕,叫【現在申請】還是【立刻申請】呢?
如何決策,還是交給AB測試吧~
3. 頁面佈局頁面佈局,主要指的是同頁面中的不同元素的排列方式。
4. 演算法最佳化演算法最佳化,應該也是AB測試的一個重要場景。
上線前的演算法,基本都是基於歷史資料進行演算法模型的訓練、搭建。在本地模型效果再好,上線後也不一定有良好的表現。只有線上才是檢驗演算法效果的決定性標準。
但誰也不能確保上線後的效果吧?那這時先用小流量做一些AB測試,是非常不錯及通用的選擇。
三、流量分配AB測試的基礎概念也講了一些,其中很重要的一個概念就是使用者流量分組。實際落地時,是按照一定的規則,讓使用者隨機訪問某個版本,那具體該如何進行流量的分配呢?
關於流量分配,主要的要點有兩個:同層互斥分配和分層流量正交。
1. 同層互斥分配每個分層都擁有全部流量。在同一個分層中,多個試驗共用100%的流量,試驗之間流量互斥。例如在同一分層中,試驗1佔用了40%流量,則試驗2最多隻可使用60%流量,以此類推。
有以下示意圖:
當同時執行多個試驗時,如果希望試驗結果儘可能精確,需要確保試驗之間互不干擾,則建議將試驗建立在同一分層,同一個使用者只會進入該分層中的一個試驗。
2. 分層流量正交分層意為複用使用者流量,如果驗1和試驗2使用不同的分層,則試驗1和試驗2均可分配最多100%的流量。在此情況下,同一個使用者將會同時進入試驗1和試驗2。
當兩個試驗處於不同層時,需要確保試驗內容互不相關,否則將會干擾試驗資料。
目前平臺中的每個實驗,獨立為一個實驗層,一份流量穿越每層實驗時,都會隨機打散再重組,保證每層流量數量相同。
舉個例子:假設我現在有2個實驗,實驗A(實驗組標記為版本A1,對照組標記為版本A2)分佈於實驗層1,取用該層100%的流量;實驗B(實驗組標記為B1,對照組標記為B2)分佈於實驗層2,也取用該層100%的流量(要注意,實驗層1和實驗層2實際上是同一批使用者,實驗層2只是複用了實驗層1的流量)。
如果把A1組的流量分成2半,一份放進B1組,一份放進B2組;再把A2組的流量也分成2半,一份放進B1組,一份放進B2組。那麼兩個實驗對於流量的呼叫就會如下圖所示。此時實驗A和實驗B之間,就形成了流量“正交”。
關於AB測試,今天就先分享這些。下篇文章將分享一下行業中AB測試系統的調研,看看各大廠商是如何將AB測試產品化的。
本文由 @冬至 原創釋出於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議。