編輯導語:讀懂客户對於用户研究工作過程中極為重要,本文作者分享了基於遊客評論的消息價值來做用户研究的相關內容,講述了遊客研究的過程和步驟等,感興趣的一起來看看。
繼上一篇文章從理論與工具推薦的層面分享瞭如何從評論中讀懂用户,這篇文章我將從頭到尾將用户評論的獲取再到內容分析的樣貌全盤呈現,以期對評論分析有需求的同學們提供更加詳盡的幫助。沒閲讀上一篇文章的可以點擊我的個人主頁查看。
為了使行文更加便捷,本篇分享我將以評論豐富、反爬措施寬鬆的旅遊行業舉例。假如我是馮小剛電影公社的管理者,面對各個OTA平台海量的遊客評論,開始了自己的遊客研究之旅。
一、評論內容的獲取據瀏覽發現,景區的在線評論集中在幾個頭部OTA網站,分別為攜程、去哪兒、途牛、美團四家。
第一步先將景區在這個平台的網址蒐集下來,分別進行評論內容的採集,文中以
攜程網為例。
第二步打開Python,編寫代碼(網上也有很多可以直接調用的代碼),配置好你所需要爬取的頁數範圍以及所期待爬取的字段,開始採集即可。如若需要攜程評論爬取的源碼,評論區留言即可。
倘若是非編程手段,這裏以後羿採集器為例,安裝好後,輸入網址,點擊智能採集,等待加載頁面,在頁面底部編輯將不需要的字段剔除,文中只保留了用户id、評論內容與評論時間。
在爬取完後,生成excel表格,打開表格可以見到已經採集完畢,共得到3900條數據,至此數據採集階段結束。
二、第二步、預處理評論數據分詞與去除停用詞。打開Rost cm6軟件,發現其只支持文本格式的內容,於是將excel表導出為文本格式。而後在Rost cm6的界面中打開分詞窗口,選中待處理文件,選擇結果保存位置,選擇停用詞表,而後確定運行即可。
三、第三步、詞頻分析與情感分析同樣的是Rost cm6,打開詞頻分析窗口,選擇上個步驟中輸出的分詞結果,確定分詞,得到按照詞頻排序的excel文件,將其按照景區風格、娛樂體驗以及情緒感知三個維度分類,歸結出以下表格。
由表中內容可以見得在遊客心目中馮小剛電影公社的風格維繫在與景區定位相一致的水平上,即由高頻詞中的“芳華”、“南洋”、“民國”、“穿越”等詞語相對應,也能看到“海南”、“海口”代表地方特色的區位詞被反覆提及。
其次遊客對景區的娛樂體驗的感知則絕大部分集中在“拍照”上,“服裝”、“衣服”、“旗袍”等代入式的拍照體驗也表明景區給遊客帶來的價值多是單向互動的環境塑造,同時從“門票”、“票價”中可以看到遊客對於景區的門票售賣頗為看重,另外“晚上”、“夜景”頻繁出現,表明相較於白天景區,晚上的馮小剛電影公社具有另一番特色。
故而被遊客在意,而景區內的“冰雪”大世界、“海洋館”也給遊客留下不少印象;此外,高頻詞的情緒感知維度中,見到“值得”、“好玩”、“好看”、“方便”等詞頻現,同時也見到“不值”、“收費”、“太貴”、“便宜”等對立的感知,可以見得在不同羣體的判別標準中,票價與景觀具有截然不同的作用效果。
到這一步就可以實現了最基礎的文本分析即詞頻分析,接着為了使詞頻更加可視化,將其導入到上一篇文章推薦的詞雲網站中生成詞雲。
依舊是在Rost cm6域內,打開情感分析窗口,導入未分詞的評論文本,一鍵分析即可,經過簡單處理,得到馮小剛電影公社的遊客評論情緒如下。可以發現遊客對馮小剛電影公社的評論中積極情感比例大於消極情緒的比例,總體情感偏向大致呈現積極態勢,而且情感的極端性不顯著。
四、第四步、語義網絡共現方便起見,本文只在Rost cm6中生成最基礎的語義網絡圖,生成過程不做贅述,與上文提到的詞頻分析、情感分析相似。得到語義網絡圖如下(本文將其按照積極情緒與消極情緒分別製作了語義網絡圖)。
1. 積極情緒馮小剛電影公社遊客表達的積極情緒多為好看、好玩、適合等,這些積極情感的產生與景區目的地的服務定位相合。
從積極情緒的語義網絡結構圖可以看出,“拍照”作為中心節點之一,與“旗袍”、“衣服”、“服裝”等詞彙密切聯繫,同時“晚上”也是頻繁提及的詞彙,證明拍照這個娛樂活動在遊客的體驗中摻雜着諸多與景區內的服飾提供服務聯繫密切。
再看到以“建築”為中心節點的詞羣,“南洋”、“民國”、“穿越”、“年代”等詞彙頻現,與景區的建築風格完全相一致;另外看到以“芳華”為中心詞的詞彙則多和“公社”、“馮小剛”、“拍攝”、“小院”聯繫起來,可以認為在景區裏,芳華小院的地位不輕,多為遊客關注且產生好感。
2. 消極情緒遊客在消極情緒中多展露出懊惱、遺憾等。其產生原因與門票價格與景區內容管理以及遊客自身認知等多種因素相關。
景區門票價格的設置不合理導致了遊客體驗情緒不佳,致使產生消極情感。從消極情緒的語義網絡結構圖(右圖)中可以看到,以“門票”與“景區”兩個關鍵中心詞為節點的詞羣中表現出了主要的消極情感。
例如“門票”連接的“還要”“不便”二詞反映出園區重複收費等現象嚴重,激發遊客的不滿也使遊客感覺遊玩體驗的完整性被破壞;另外“景區”連接着的 “不大”“票價”等詞有效反映出對於部分產生消極情緒的遊客來説,馮小剛電影公社的面積以及內容不夠豐富,使得遊客產生景區較小值不回票價的遺憾情感。
五、第五步、主題分析本文使用到基於TF-IDF方法的主題詞聚類分析,TF意為詞頻,用來測算詞條出現的頻率,而IDF意為反文檔頻率,用來衡量前述詞條的普遍重要性。
其計算公式為:
TF-IDF=TF×IDF
對已經經過調查上述數據預處理的在線評論文本另存為xlsx格式導入Python,進行LDA主題模型構建,採用TF-IDF方法,反覆試驗調整詞彙表為最高閾值為0.4(即該詞在超過40%的評論裏出現過則作廢,認為其無特徵意義),聚類主題數為4個。最後得到的在線評論主題詞分類結果如下表所示。
主題詞聚類的結果顯示,遊客對馮小剛電影公社的感知因素有主打特色、娛樂設施、基礎設施與情緒感知四個方面。可以認為較有多面性與複雜性。並且主題聚類結果與上文詞頻分析人腦歸結出的三個類別高度重合,很符合預期。
馮小剛電影公社的景點之一即攝製場地,表現在遊客體驗中頻繁表現出的“芳華”以及“電影”、“公社”以及“小院”中,證明其在遊客遊覽的過程中產生了重要影響且評價多為“不錯”。
同時可以從第二個主題中看到遊客遊玩體驗到的“拍照”、“穿越”感、“民國”、“南洋”以及“天氣”是為其娛樂過程中着重在意的感知,備受青睞和關注。
另外從遊客的情緒感知即第四個主題可以看到“性價比”、“不值”,“喜歡”、“一般般”等對立的情緒感知,可以認為對不同人羣來説,馮小剛電影公社的體驗不盡相同,或為價格敏感型顧客與否的區別,景區可以從價格歧視的角度出發設置票型以顧及不同消費者羣體的感受。
六、第六步、給結論經過上述遊客評論分析,作為馮小剛電影公社的管理者就可以總結出以下結論以支撐在運營與管理側的改良。
- 其一,改善景區入口服務。景區應該制定合理的定價策略,例如考慮到價格接受程度不同的遊客的體會,實現差別定價策略。在景區可以接受的範圍內,對不同遊客如普通遊客、學生、幼兒、老年人等定義不同的價格標準。再有就是錯峯調整票價,節假日等旅遊旺季不妨全價,而在旅遊淡季時,票價就需要折扣,同時不同渠道的購票也應該差別定價。同時將套票的價格放低,鼓勵遊客購買優惠的套票,以鼓勵遊客體驗景區全貌。
- 其二,景區內應該增加導遊類服務人員,為遊客遊玩時長做加持,使不愛拍照的遊客也能在工作人員的講解下沉浸在景區的風格與建築背後的故事中,減少類似不值票價的情感出現,使此類遊客的遊玩時長加長。
- 第三,加強市場監管,提升旅遊服務質量。對市場監管的加強,嚴格規範馮小剛電影公社景區內的各類市場行為,對提供的服務、產品的質量制定一套統一的標準。堅決禁止宰客的行為出現,尤其對景區內的服裝租賃服務加強監管。以一系列的措施解決遊客遊玩中遇到的問題,減少遊客的消極情緒產生。
本文由 @ 我叫徐知魚 原創發佈於人人都是產品經理,未經作者許可,禁止轉載
題圖來自 unsplash,基於 CC0 協議