編輯導語:隨着網絡的逐漸普及,我國網民數量不斷增加,互聯網成為了人們表達情感和獲取信息的重要途徑,互聯網輿情也成為了社會輿情中重要的一部分。在這種大趨勢之下,如何利用數據分析技術做好輿情挖掘,是值得我們去思考的問題。
隨着互聯網技術的發展和新媒體應用的創新,人們越來越傾向於通過微博、微信、抖音短視頻等社交媒體來表達自己的觀點、傳播自己的需求、分享各類信息。
如今,任何搬上的互聯網的話題都有網友在下面表達看法,提出各自的建議和意見,有時甚至會掀起不小的“互聯網風浪”。
輿論當下,收集、處理和挖掘其中的價值,洞察各式各樣的觀點、情緒、口碑和民情,可以為企業提供商業數據和情報,幫助企業更智能地做決策;還可以為政府挖掘社會現狀和輿論民情,提高社會治理的整體水平。
一、輿情分析的特點1. 數據冗雜首先,從數據基本屬性來看,輿情信息包括文本、圖形、視頻、音頻等,都屬於非結構化數據。其次,數據量大、數據源多。隨着近幾年網絡社交媒體的快速發展,公開社交平台越來越多,相比較於十年前,人們可以在更多的平台上發表自己的看法。
輿情分析的數據源需要覆蓋到互聯網上幾乎全部的公開信息,不僅有國內的媒體及社交平台,還有國外的各家媒體和社交平台。
2. 需求量大常見的互聯網行業、金融行業、房地產行業、教育行業、餐飲行業、各類消費品行業等都是重點關注輿情分析,具備強大公關能力的行業。
同時,在政府部門,隨着電子政務的發展,輿情監測和輿情分析能力也得到了很大的重視。輿情監測和分析系統為各級各部門政府機構,第一時間提供各類社會輿情資訊。
説到底,“數據是金礦”,輿情監測、分析和管理最大的效用就是對互聯網公開信息的大數據分析和價值挖掘,為政府和企業的智能決策提供輔助,達到較大的社會效益和經濟效益。
因此,各行各業都需要輿情分析。
3. 附加值高上一點説到,數據是金礦,輿情分析的結果可以幫助政府和企業在一些事情上達到較大的社會效益和經濟效益。
輿情分析能夠為政府和企業提供多維度的數據分析和高附加值的信息洞察,具體來説:
1)負面消息挖掘
輿情監測的核心點便是負面消息的數據挖掘,如果不能及時準確的找到負面信息,任由其發酵壯大,後果是不堪設想的。政府的公信力遭到嚴重質疑,企業的經濟利益遭受巨大的損失,整個社會狀況也會遭受不小的動盪。
2)口碑信息挖掘
比如,某茶飲品牌新推出一款茶飲品,企業最關注的往往是銷量和口碑。一個好的口碑可以帶來整體銷量的大幅度提升,這也是為什麼口碑營銷在當下這麼火爆的原因。
有針對性的對於某一產品進行口碑監測,可以幫助企業改善產品,及時調整市場營銷策略,提升產品的滿意度。
3)競品信息挖掘
針對目前市面上現存的或潛在的競品企業,進行信息監測、情報挖掘,分析其背後的數據價值,通常可以幫助企業較好的掌握市場競爭的主動權。
4)重大事件分析
無論是網絡熱點事件還是產品營銷事件,通過對事件的傳播分析,監測事件的發展脈絡,挖掘其背後的輿論爆炸點,掌握事件的傳播途徑,可以為快速處理事件和傳播效果分析提供數據依據。
5)民生信息挖掘
對於政府部門來説,最看重的就是民生輿情監測。通過對網絡熱點事件的輿情監測,可以瞭解到公眾對其的評論、情緒、傳播方式,對於政府部門引導和控制輿情提供了良好的決策輔助。
尤其是在今年年初新冠疫情爆發的那段時間,民生輿情監測達到了一個巔峯。
4、技術複雜輿情監測與分析,不僅需要強大的數據收集和處理能力,還需要強大的數據挖掘能力,面臨着不小的技術挑戰,主要有以下幾個技術難點:
1)全面性
輿情監測與分析需要覆蓋到幾乎所有的互聯網信息,數據採集系統要保證數據全面收集、不遺漏,強大的數據採集系統是輿情監測的基礎保障。
2)及時性
互聯網環境下,輿論信息傳播速度極快,輿情監測與分析就是在與互聯網速度賽跑。政府和企業都需要第一時間掌握好輿情動態,實時預警、快速分析、及時響應。
3)精確性
除了要具備及時性,更要精準檢索目標數據。面對海量的輿情數據,輿情數據分析系統不僅要找到相關信息,還要排除無效信息的干擾,最大程度匹配到監測數據。
4)豐富性
輿情數據分析系統除了基本的數據精準甄判之外,還需要具備更強大的數據信息挖掘能力。比如,需要對數據信息進行標籤挖掘、地域判斷、信息分類等等,最大化挖掘出數據信息背後的附加值。
二、傳統數據分析技術助力輿情分析首先,我們來看下傳統的數據分析過程:數據採集一數據清理一數據變換一數據挖掘一模型評估一可視化展示。
由於輿情分析的及時性,數據需要從互聯網上實時採集。分析結果要實時輸出呈現,整個數據挖掘過程需要穿插於整個信息流之中。
輿情信息以流式輸入到數據分析系統中,通過ETL處理標準化的數據,進入到數據挖掘的過程,利用各個機器學習算法模型進行分析和評估。
挖掘結果經過可視化處理後,以實時數據分析報告或實時數據大屏的形式呈現給用户。
此外,整個數據分析系統需要具備動態干預能力,來保證數據挖掘規則和模型的前後一致性。相較於傳統數據分析的靜態過程,輿情數據的分析和挖掘是一個不間斷、實時的過程。
三、數據分析新技術帶來輿情分析新發展1. SaaS產品助力隨着自媒體的壯大,網絡傳播速度的增長,互聯網輿情的熱度不斷髮酵。輿情分析SaaS產品,能夠幫助政府和企業更快的搭建自己的輿情分析系統,快速入場輿情分析。
傳統的輿情分析,場景和模式相對單一,網絡輿情分析的精細度要求更高,越來越差異化、個性化。在SaaS產品的標準模式之下,針對不同行業、不同場景實現基於平台的精細化運營變得越來越重要。
政府和企業利用好平台工具,打造輿情分析閉環系統,構建精細化運營的產品矩陣,才能真正挖掘到輿情分析背後的超高附加值。
2. 實時數據大屏助力隨着數據可視化技術的發展,數據大屏近幾年越來越盛行,尤其是在數據監測方面受到政府和企業的重點關注。數據大屏最大的一個特點就是:數據實時、預計及時、響應迅速。
比如在良渚古城遺址的輿情分析大屏中,展現的是景區遊客熱搜、微博熱搜和應急指揮信息處理三個部分的內容。通過對於網絡輿情的監測,進行景區應急指揮的及時響應和安全保障。
圖源:袋鼠雲EasyV
3. AI深度分析助力隨着AI在近幾年的快速發展,各類技術框架和分析手段地出現,為輿情分析和挖掘提供了新技術、新手段、新工具。
不僅僅侷限於分詞、實體識別、情緒判斷、關鍵詞提取等基礎的文本分析,比如主動事件發現、智能預警預判、智能信息檢索等技術也走進人們的視野。
與此同時,AI技術的發展加速了模型算法的工程實現,新模型新算法可以取代輿情服務中的人工部分,來降低不少的輿情分析成本。
本文由 @可愛的數據控 原創發佈於人人都是產品經理,未經許可,禁止轉載
題圖來自unsplash,基於 CC0 協議