朱元璋建立大明王朝,一心希望讓大明江山傳千世而不覆,可惜的是他準備好江山給太子朱標,朱標卻死在了朱元璋的前頭。太子朱標去世後繼承人是可以在朱元璋的其他幾個兒子中選的,但是在各方勢力的選擇下,本來最有希望成為第二個太子的燕王朱棣落榜了,皇太子朱允炆成功接手大明王朝。
朱允炆繼位之後對幾個有能力的叔叔並不放心,也是幾次對他們下手,最後北方的燕王朱棣忍不住了,起兵發動靖難之役,建文帝朱允炆也是慌亂應對,結果是朱棣趕跑了朱允炆,1402年朱棣在南京登基,作為失敗一方的建文帝卻離奇消失,他的去向也成為了一個未解之謎。朱棣雖然是趕跑了朱允炆,但是並沒有説可以直接坐穩龍椅,威脅朱棣皇位的不確定性因素還有很多。
朱棣起兵的理由是“清君側”,現在反倒是君讓他趕跑了,朱棣也是一方面消除所有的不確定因素,一方面不斷的樹立自己皇位的正統。朱棣為了確定朱允炆的去向也是花了大功夫的,也將朱允炆的至親,死忠都是殺的殺,流放的流放。他在不斷的建威的同時也樹立自己皇位正統的表象,古人對死去的祖宗有非常強的信任,還非常的在意上天的安排。就像宋真宗為了表示國泰民安,還安排了天書這種毫無水平的東西。朱棣也去拜朱元璋,表示對朱元璋安排的遺憾。朱棣除了祭拜老父親,還有很多東西都是在讚揚自己的老父親,還有希望給朱元璋修建一個超級無敵的功德碑,不過最後爛尾了。
朱棣在位的時候也是有一次非常大的“祥瑞”,中國古代各個時期出現祥瑞表現的不一樣,當然有一個是常見的表現方式,那就是天現異像,還有就是出現非常不一樣的生物,比如傳説中的神獸,神獸到底是否真的存在,這個本人表示支持存在,也許就像很多生物一樣,他們只是滅絕了,又或者是他們只是一般的生物被神化了而已。在這些神話神獸中,麒麟相信很多人都是知道,麒麟一直以來都被認為是瑞獸,而且作為龍族的後代,它也是皇家所用的圖案。
朱棣時期就有一個小國為了表示對大明王朝的敬仰之情,向朱棣進貢了一隻麒麟,要知道在中國古代瑞獸出現那就是表示國家要興盛了,當時整個京城都沸騰了,都想看一眼這種神獸,朱棣也是相當的高興,他還親自出城迎接這隻瑞獸,希望讓國人知道他的皇位就是天命所歸,並且還命畫師給這瑞獸畫了畫像,這個畫像還留了下來,現在是保存在台北故宮博物館。
不過現代人看到這“麒麟”畫像都覺得可笑,進貢給朱棣的麒麟其實就是我們現在都知道的長頸鹿,長頸鹿與神話傳説中的麒麟相差的相當的大,按照古籍記載也不會是長成那般模樣,但是就是文武百官都沒有説出來,其背後的原因應該是相當的簡單的。當然對於這長頸鹿的來源還有説是鄭和帶回來的,但是將它確定為麒麟明知道是錯也不改,應該是朱棣默許,不然哪個畫師敢稱它為麒麟呢?不論朱棣以何種方式獲得皇位,至少他是對的起大明江山,也對的起天下百姓。
目前,無論是各大電信運營商,還是以華為、中興為代表的設備廠商,或者以高通為首的芯片廠商,都在5G領域摩拳擦掌。在業界看來,5G不僅是新一代的移動通訊技術,更會成為萬物互聯的基礎架構,5G所帶來的影響將徹底重塑和改變世界。
中國移動方面表示,與前幾代通信技術相比,5G不只要求速率提升,而是追求性能全面提升:比如在速率上平均可提升10-100倍,連接密度可提升10倍,時延將降為4G的1/5,從而滿足三大應用場景,即增強移動寬帶、大連接、超高可靠和超低時延通信的需求,而主要的5G應用均可納入這三大場景的範疇之中。
與行業普遍的預測一致,中國移動方面也向澎湃新聞(www.thepaper.cn)指出,2020年是實現5G應用的關鍵年。目前5G正處於技術標準形成和產業化培育的關鍵時期,第一個版本的標準將在2018年中完成。
一,增強移動寬帶場景
代表應用:4K高清視頻、虛擬現實、增強現實、遠程醫療、遠程教育、外場支援等
中國移動上海公司的相關負責人向澎湃新聞記者(www.thepaper.cn)解釋道,增強移動寬帶場景主要是指對帶寬有着較高需求的應用,視頻類的應用是最主要的表現形式。
“現在4G網絡每秒的下載速度可以達到百兆級,而5G將提升到Gbit/s,其理論峯值速度甚至可以超過目前使用的家用寬帶。”中國移動上海公司相關負責人向記者表示,當速度達到Gbit/s的級別時,將大大推進4K高清視頻、VR/AR(虛擬現實/增強現實)視頻在生活中的應用。
與此同時,5G支持下的超高清傳輸、AR/VR、遠距離視頻傳輸又將衍生出更多的應用,譬如,低時延和每秒數千兆比特的速度將支持計算密集型的AR/VR用户交互 ,這一技術可以被用於遠程教學、遠程醫療、外場支援等。而移動化的VR/AR產品,比如智能眼鏡,又將幫助人們擺脱屏幕和電子設備的束縛,可以在任何環境或表面上實現虛擬顯示。
增強移動寬帶還可以在很多行業中實現資源的跨地區交流,譬如醫療機構可以實現遠程會診、遠程閲片,甚至通過手術機器人實現遠程手術。
二,大連接場景
代表應用:物聯網、智慧城市、智能家居、工業信息化、智能物流等
5G將帶來萬物互聯的能力,使得參與整個社會運行的萬事萬物具備了可感知的能力。“5G意味着萬物互聯。”中國移動上海公司相關負責人表示,物聯網被認為是5G時代大連接場景的典型代表,並且物聯網也會成為5G時代發展最為迅速的產業。
6月20日,興業證券舉行了關於5G應用的專題策略會,研究團隊的分析師指出,2020年將是5G進入全面商用的關鍵節點,其中一個重要原因就是業界普遍認為2019年-2020年將會是物聯網全面大規模爆發的時期。
根據美國IHS諮詢公司的最新預測,全球物聯網設備的安裝基數將從2015年的154 億台增長到 2020 年的 307 億台。到 2025 年,這一數字預計將達到 754億台,未來 10 年複合增長率高達 17.21%。
上述負責人指出,儘管物聯網在當前社會已經有了一定程度上的應用, 但5G時代物聯網的突破在於連接密度的飛躍,一平方公里的連接可以達到百萬的數量級。
高密度的海量物聯網可以幫助現代產業向更高級的智慧產業升級,比如實現智能農業、智能工業、智能物流等等。
譬如,智能農業意味着,可通過設置監控土壤濕度和化學成分的專業傳感器,實現自動灌溉、施肥等;智能物流則可以利用物物通信實現貴重物品的追蹤。中國信息通信研究院發佈的《5G經濟社會影響白皮書》預測,到2030年,5G有望帶動我國直接經濟產出6.3萬億元、經濟增加值2.9萬億元、就業機會800萬個。
另一個方面,物聯網的廣泛應用將有助於智慧城市的部署, 其中關鍵應用包括照明、安全、能源、公用事業、物理基礎設施環境監控和交通運輸出行。智慧城市的建立將大大提高城市管理的效率,譬如可以更及時地實現交通方面的車流管理,景區的人流預警等。在城市安全方面,通過5G增強型移動寬帶,就可以更好發揮安防無人機、固定攝像頭在城市監控方面的作用。
三,超高可靠和超低時延通信
代表應用:車聯網、無人機網絡
“超高可靠性和超低時延通信最具代表性的應用場景是車聯網。” 中國移動上海公司的相關負責人介紹稱,所謂車聯網目的是擁有V2X的通信能力,即實現車與人、車與車、車與路測設施、車與網絡的通信。“實現V2X之後,當人們開車上路時,車輛通過信號可以提前告知車主路況和環境信息,譬如即將經過路口時,不需要依賴駕駛員的觀察,車輛自動就能感應到路口是否會有其他車輛通過;再比如,當遠處的信號燈做出變化時,可通過信號燈與車輛的通信告知車輛,而不需要目視。”
而車聯網同時也是實現自動駕駛、無人駕駛的重要途徑。“在自動駕駛過程中,車輛的傳感器從監測到路況信息到命令車輛的大腦做出反應的時間越短,那麼自動駕駛的安全性可能就會更高。所以這就要求通信網絡具有高可靠性和低時延的特點。想象一下,你的車在行駛中突然斷網了,或者本該在0.01秒內踩剎車結果一兩秒後才做出反應,會有什麼後果。這就是為什麼車聯網的發展離不開5G。”
無人機網絡的建立同樣需要超高可靠和低時延通訊的支持。傳統無人機遙控系統採用的是點對點的遙控信號傳輸模式,目前無人機用於圖像傳輸的遙控信號頻段,能夠支持較高帶寬的視頻傳輸,但傳輸距離相對較短,最高為5公里,並且遙控信號容易受周圍環境的影響,穿透能力會下降,因此一般只能在視線範圍內飛行。而用5G無人機則可以突破“點對點”遙控信號傳輸的瓶頸,理論上只要有電信信號覆蓋的地方,就可以遙控無人機。
據悉,去年愛立信曾與中國移動合作在無錫完成世界第一個無人機5G無人機現場試驗,驗證了端到端延遲可從LTE網絡中50ms降低到15ms的可能性。試驗結果表明,無人機可和手機一樣在不同的小區間切換,且能和手機和諧共處、共享基站資源,為無人機網絡的商用打下了基礎。
2017年世界移動大會的主題是“勢在人為”。
5G首版標準將在2018年中完成
中國移動指出,與行業普遍的預測一致,中國移動也向澎湃新聞指出,2020年是實現5G應用的關鍵年。目前5G正處於技術標準形成和產業化培育的關鍵時期,第一個版本的標準將在2018年中完成,借鑑以往經驗,5G產業化成熟並實現規模商用至少到2020年。
“任務重、時間緊,每個階段都會影響5G的生命力。”中國移動相關負責人表示,要想在計劃時間內完成5G的研發和實驗任務,還存在以下幾大重點問題待解決:一是保證標準化按時高質量完成,5G標準必須是滿足未來發展需求的,必須是具備競爭力的標準;其次是保證產業端到端打通,產業上任何一個環節時間落後,都將成為瓶頸,拖後商用的時間,因此需要整個產業鏈的集體智慧,特別是在涉及到新工藝、新技術、新架構的生產製造方面;第三是保證網絡可運營,一方面要解決建設、運營、優化、與原有網絡協同等部署問題,另還涉及業務應用、終端普及、市場推廣等商用問題。
中國移動目前承擔國家5G技術研發試驗,在我國IMT-2020推進組的主導下,聯合建設了北京懷柔外場試驗環境,在全球啓動最大規模5G外場測試。
據悉,中國移動的5G試驗將分三步走:第一階段測試的重點目標是對5G關鍵技術的可行性進行驗證,為5G選擇哪些技術做支撐。第二階段測試的重點目標是5G的系統樣機試驗,重點推動產品硬件和架構成熟,力促元器件加快成熟。第三階段就是規模試驗,重點目標是驗證規模組網下的網絡性能、運營部署策略、多廠商互聯互通等,通過預商用促進商用產品的端到端成熟。
目前中國移動已在2016年底完成第一階段關鍵技術驗證,進入第二階段5G原型樣機試驗。中國移動的5G試驗第一階段重點驗證了大規模天線、新型多址、新幀結構、用户為中心網絡等關鍵技術。
(2017-09-18)
如同我上一篇文章《給用户畫了像,又如何》所講的一樣,用户畫像已經人盡皆知了,在貌似滿足用户需求的思想指引下,給用户進行了深入的畫像並加深對用户的理解,但之後又該如何匹配合適的商品最終做到“人貨合一”呢?
很多零售商並沒有深究,往往覺得貨就是貨,賣出去就行,這其實還是自己的本位思想在作祟,沒有做到把最合適的商品呈現給最合適的用户,造成的現象則是:爆款總是斷貨,不好賣的貨總是呆滯,客户看到店鋪裏堆了大量自己並不喜歡的產品時,體驗可想而知。
如何解決上述問題,就需要對自己的商品有深刻的理解,而“商品畫像”則是解決這個問題的必由之路。
商品畫像如同用户畫像一樣,可以簡單理解成是商品海量數據的標籤,根據商品的特徵、設計、功能、口味、波次、價位段、流行度、銷售狀況、促銷力度、銷售渠道差異,將他們區分為不同的類型,然後每種類型中抽取出典型特徵,賦予名字、特點、場景、統計學要素等描述。
而商品畫像的意義則在於可以對商品進行精準的定位,讓不同的商品迅速匹配到處在不同地域、時間、偏好、階層中的消費者,進而去更加優化用户的體驗,同時商品畫像給商品所貼上的各種“標籤”可以驅動後端供應鏈的各種的行為,如預測、補貨、促銷、庫存、採購、生產、物流等等,都是要和這些標籤相匹配,標籤不同,模型不同,流程不同,管理的模式也有所不同,而且一切都是動態的。
讓眾多零售商對“商品畫像”重視程度不足的原因,主要是商品的管理往往扮演的是“幕後英雄”的角色,商品自身沒有消費者自身“上帝”的地位,也沒有場景那麼炫目多彩,商品管理人員甚至有時不會和消費者直接發生接觸,因而常備零售商所忽視,忘了“商品”才是消費者體驗成敗的關鍵所在。
如同自己找到了一個目標,手中用於擊中這個目標的手段(貨)很多,但具體哪種“工具”能夠最經濟、效率最高擊中目標並不非常清楚,好不容易瞭解了手中的“工具”,而“工具”(暢銷款)又缺貨了。
有人説商品畫像挺簡單的,從銷售歷史的Top10和Bottom10的商品清單,就可以看出好賣還是不好賣,好賣多進貨,不好賣少進貨不就行了嗎。
但真的那麼簡單麼?
銷售排行榜上排名第一的商品由於半價促銷帶來大量銷量,或者由於鋪貨相對更廣,就能説一定比第二名、第三名等沒有促銷政策或鋪貨較窄的貨好賣嗎?
以時尚類行業為例,該類商品的一個典型特徵是銷售週期基本上都是在3個月左右,在對商品進行畫像的時候,主要從商品的自然屬性和銷售狀況出發,要考慮商品的顏色、面料、尺碼、價位段、品類、品類結構比、波段規劃、季節性特徵、銷售渠道、銷售區域、門店鋪貨情況、競爭對手錶現、市場容量/佔比、產品生命週期趨勢、供應商支持情況、整體銷售趨勢以及天氣情況,並且依據分類算法模型給不同的商品貼上不同的標籤,來綜合判定不同的商品會適合於什麼類型的消費者,以及商品的暢平滯的情況和原因,並且以上維度是要交叉分析的。
例如渠道和產品維度、渠道和時間維度、產品和時間維度等進行交叉分析,鑑於這些商品上市的複雜度,就需要藉助機器學習的算法來進行分類。
在不同的銷售渠道里銷售的價格未必一樣,面向的消費羣體未必一樣,每家店面鋪貨的情況未必一樣,南北方的氣温不同導致上市的時間會有所不同,而商品品類的結構在不同的區域也會不同,同時供應商的產能制約更是一個不可忽略的因素,如果競爭對手在忙上添亂,更是會讓局勢錯綜複雜,而整體行業數據的分析更是必不可少,所以這時就需要複雜的商品畫像,讓商品的自然屬性和銷售狀態畫像更加清晰的呈現在商品決策者面前。
而零售便利店業態雖然和時尚品零售行業不完全一樣,但也需要清晰的商品畫像,重點考慮的因素包括商品的口味、特徵、功能、天氣、價格、當時活動、門店位置、競爭對手等因素。例如晴天將會導致中午氣温上升,口味清爽、蛋白質高的便當會好賣,或者陰天將導致氣温下降,那麼消費者更加偏向口味濃郁、熱量足、分量大的便當,所以零售商對便當的口味、分量、價位段、適用人羣等要有清楚的認識,同時把便當和天氣的外在因素結合在一起,形成一個完整的商品自然屬性畫像,這樣對於目標消費羣體更有針對性的銷售和備貨。
一旦一個商品被貼上“好賣”的標籤,那麼對於預測要求開始提升,精度一定要高,而庫存則要備足,後端的生產、原材料採購也要保證不出事,確保不斷貨;一旦被貼上“不好賣”的標籤,那就趕快清庫存找後路,防止庫存積壓。
用户畫像是產品的根基,但是“商品畫像”是產品的外延生命力的象徵。
好的產品必須是易於在人羣中推廣的,一句話能講清楚,如何讓商品和消費者進行迅速匹配,同時通過商品畫像來迅速啓動需求鏈管理流程:預測、促銷、補貨、採購、生產、物流、配送等等,讓好賣的商品不斷貨,利潤最大化,讓不好賣的商品趕緊清倉騰位置,不要形成呆滯庫存,這樣整個鏈條從消費者到零售商再到供應商就徹底地由商品給滿意、高效、健康串聯了起來。
[新零售行業峯會來襲!]2016年馬雲在雲棲大會上首提“新零售”,自此“新零售”已成為當下電商界最熱詞,各電商大佬反覆提到“線上線下融合”。如今,無人便利店、無人貨架等模式也上升至新的風口,入局者蜂擁而至……
從舊到新,從傳統到智能,零售經歷着種種變化。對於企業來説,如何做到真正的落地執行?怎樣借力實現銷量和渠道的裂變?現場演講嘉賓將在峯會上碰撞出精彩的火花,這將是一場新零售思想的盛宴。
版權聲明
(2017-09-22)
焦裕祿,60年代擔任河南蘭考縣的縣長,在崗位上工作兢兢業業,是全國幹部的楷模,焦裕祿在工作中表現出“親民愛民、艱苦奮鬥、科學求實、迎難而上、無私奉獻”的精神,被人們稱為“焦裕祿精神”,1964年焦裕祿病逝於鄭州,年僅42歲,他有個女兒名叫焦守雲。
焦守雲是焦裕祿的二女兒,是焦家兄弟姐妹中最幸運的,因為六個兄弟姐妹,只有他上過學,上學前他跟着奶奶一起生活,焦守雲的人生跟父親一樣,既平凡又充滿意義,父親逝世後第二年,焦守雲來到天安門,受到毛主席的親自接見。
1966年9月15日,焦守雲年僅13歲,她是毛主席請來的客人,從開封來到北京,一路受到最好的待遇,一下火車就被毛主席派過來的人接走,而坐軍用車,在北京住樓房,睡的也是軍用被褥,有大米飯和白菜炒肉吃,出門坐公交車可用代表證免票。
13歲的焦守雲在天安門上,跟毛主席握手,當時她穿着打補丁的衣服,穿着一雙破舊的布鞋,不過精神面貌很好,而且受到毛主席的鼓勵和親切問候,這樣的際遇讓焦守雲成為當時的名人,她決定把父親為人民服務的艱苦作風傳承下來。
1968年,焦守雲年僅15歲,但她報名參軍了,當時的她是個皮膚白皙的女孩,有一雙明亮的大眼睛,鼻頭微翹跟父親焦裕祿挺像,後來到20歲,焦守雲被選為“十大代表”年齡最小的,在戰友眼裏,焦守雲是個活潑有上進心的普通士兵。
焦守雲一生銘記自己是焦裕祿的女兒,每逢父親去世週年紀念日,她都要去紀念父親,並開一次家庭會議,把父親全心全意為人民的精神灌輸下來,後來焦守雲退休後,在河南省焦裕祿精神研究會繼續任職,她希望像父親一樣,盡最大的努力為社會做出貢獻。
2008年奧運會時,焦守雲成為奧運聖火的傳遞員,在開封和女籃第一高中鋒鄭海霞點燃火炬,生活中的焦守雲也很愛體育,雖然現在焦守雲退休了的,但她依舊繼續發光發熱,為社會做出自己的貢獻。
在開會和報告中,焦守雲多次宣傳父親的“焦裕祿精神”,她希望年輕一代更多瞭解父親,讓父親的事蹟流傳下去,鼓勵一代代年輕人,焦守雲還表示,新時代的建設離開父親的“焦裕祿精神”,所以焦守雲常説:“在父親離開的日子裏,我把宣傳父親的事蹟當成自己的責任。”
(2017-08-14)
此公開課為極客公園策劃的「極客公開課•Live」第十四期。本次公開課,我們將邀請到友盟+首席數據架構師&數據委員會會長張金來為大家講解到底什麼是用户畫像,快速建模框架,如何提高用户精準畫像的的準確性,從理論到應用的一起了解用户畫像。
什麼是用户畫像?
用户畫像也叫用户標籤, 是基於用户行為分析獲得的對用户的一種認知表達,也是後續數據分析加工的起點。從認知心理學的角度,用户標籤其實與人認知世界的方式相一致,人為了簡化思考,通常也會通過概念化的方式簡化事物認知,這種概念認知就是標籤。因此,用户畫像的內容可以很寬泛,只要是對人的認知,都可以叫做用户畫像。例如:今天路過這個門口三次的人,也可以是一個標籤,只要他有合適的應用場景。
另外,我們需要從概念上加以區分,用户標籤和用户透視,一個是個體的認知,一個是整體的標籤分佈,二者都經常被人統稱為用户畫像。今天我們在這裏説的用户畫像主要指標籤。
用户畫像的 4 個核心價值
一、市場細分和用户分羣:市場營銷領域的重要環節。比如在新品發佈時,定位目標用户,切分市場。這是營銷研究公司會經常用的方式。
二、數據化運營和用户分析。後台 PV\UV\留存等數據,如果能夠結合用户畫像一起分析就會清晰很多,揭示數據趨勢背後的秘密。
三、精準營銷和定向投放。比如某產品新款上市,目標受眾是白領女性,在廣告投放前,就需要找到符合這一條件的用户,進行定向廣告投放。
四、各種數據應用:例如推薦系統、預測系統。我們認為:未來所有應用一定是個性化的,所有服務都是千人千面的。而個性化的服務,都需要基於對用户的理解,前提就需要獲得用户畫像。
用户畫像的基礎:數據
做好用户畫像需要一定的門檻,一方面是數據的體量和豐富程度,另一方面是技術和算法能力。今天介紹的經驗基礎是[友盟+]數據,首先簡單介紹一下。[友盟+]有覆蓋線上線下的實時更新的全域數據資源,每天大約有 14 億的設備,覆蓋數百萬級的網站和 APP 行為,這個龐大的數據量使得我們有豐富的數據資源來生產用户畫像,同時又要求我們能相應的技術能力來進行處理。
數據是如何生產,變成畫像的?
結合上圖,用户畫像生產流程概覽,我們將用户畫像的生產比喻成一個流水線,就如同將礦石加工成成品的過程。用户瀏覽網頁、使用 APP、線下行為,這些數據都是礦石,需要提煉、加工成為產品,最後還要通過質檢。
這個過程通常有幾個步驟。首先獲得原始行為數據,基於這些數據做特徵抽取,相當於清洗、加工的工作;在機器學習環節,會與外部知識庫有一些交互。實際上機器算法對人的理解,一定要基於知識體系,就好像我們説的概念。比如,機器給人打汽車相關的標籤,一定要首先知道汽車體系有什麼樣的分類,有什麼車型,有這樣的知識系統我們才能把人做很好的標識歸類。
最後,質量檢測,這一步也很重要。一個標籤的質量決定了後期的應用效果,如果前期對人的分析偏了,後期結果就很難做對。
用户畫像生產流程框架
上面講的是概念圖,如果具象到實際操作中,是這樣一個框架流程:
這裏先留三個懸念:
懸念一:從用户行為日誌開始到標籤產出,為什麼有兩條線?
懸念二:標籤體系為什麼只作用在內容標註上?
懸念三:為什麼下面的「評估」過程要特別標註出來?
1、從用户行為日誌開始到標籤產出,為什麼有兩條線?我們把畫像分為兩大類:第一類:統計型畫像;第二類:預測性畫像。
第一類,統計型畫像是客觀存在,這種都是興趣偏好。比如,用户每天都在看汽車新聞、搜索汽車相關的內容,基於這種行為,我們判斷這個用户對汽車感興趣。這些行為是客觀發生的,因此無所謂正確率,也不需要訓練樣本集。
第二類,預測性畫像。需要通過用户行為做預測,像用户的性別預測,尤其是挖掘人的內心態度。比如,用户在消費時,是激進的,還是保守的?有預測就有準確率。所以這裏面有很重要的評估指標,就是正確率,也需要取樣本集。這就是二者的不同,也會有不同的加工流程。
常用的一些標籤體系
再繼續介紹標籤體系,因為很多同學會問到,「我應該建一個什麼樣的標籤體系?什麼樣的標籤體系是比較好的?」通常我們會把它分為四大類:
第一類:人口屬性。比如説性別、年齡、常駐地、籍貫,甚至是身高、血型,這些東西叫做人口屬性。
第二類:社會屬性。因為我們每個人在社會里都不是一個單獨的個體,一定有關聯關係的,如婚戀狀態、受教育程度、資產情況、收入情況、職業,我們把這些叫做社會屬性。
第三類,興趣偏好。攝影、運動、吃貨、愛美、服飾、旅遊、教育等,這部分是最常見的,也是最龐大的,難以一一列舉完。
第四類,意識認知。消費心理、消費動機、價值觀、生活態度、個性等,是內在的和最難獲取的。舉個例子,消費心理/動機。用户購物是為了炫耀,還是追求品質,還是為了安全感,這些都是不一樣的。
如何判斷標籤體系的好壞?
在實際構建標籤體系時,大家經常會遇到很多困惑,我列舉 5 個常見問題。
第一、怎樣的標籤體系才是正確的?其實每種體系各有千秋,要結合實際應用去評估。
第二、標籤體系需要很豐富麼?標籤是枚舉不完的,可以橫線延展、向下細分。也可以交叉分析,多維分析。如果沒有自動化的方式去挖掘,是很難做分析的,太多的標籤反而會帶來使用上的障礙。
第三、標籤體系需要保持穩定麼?不是完全必要,標籤體系就是產品/應用的一部分,要適應產品的發展,與時俱進。比如,以前沒有共享經濟這個詞,今天卻很熱。我們是不是要增加一個標籤,分析哪些人對共享經濟的參與度高?喜歡共享單車、共享汽車。
但是,有一種情況下,標籤要保持穩定。如果你生產的標籤有下游模型訓練的依賴,即我們模型建完後,它的輸入是要保持穩定的,不能今天是 ABC,明天是 BCD。在這種情況下,是不能輕易對標籤體系做更改的。
第四個,樹狀結構 or 網狀結構?樹狀結構和網狀結構從名字上就可以看出其分別。網狀結構,更符合現實,但是層次關係很複雜,對數據的管理和存儲都有更高要求。知乎,如果仔細去看它的話題設置,其實是網狀的。
網狀的特點就是一個子話題,父級可以不止一個,可能有兩個。比如兒童玩具,既可以是母嬰下分分類,也可以是玩具下的分類,它就會存在兩個父節點之下。樹狀結構相對簡單,也是我們最常用的。網狀結構在一些特定場景下,我們也會去用。但是實現和維護的成本都比較高。比如,有一個節點是第四級的,但它的兩個父節點一個是二級,一個是三級,結構異化帶來處理上的麻煩。
第五個,何為一個好的標籤體系?應用為王,不忘初心。標籤是為了用的,並不是為了好玩,最好保證標籤體系的靈活和細緻性。
統計型標籤的生產流程
再回到剛才説的生產流程上。我先結合下面的圖介紹上半邊,統計型的標籤是怎麼去加工的。
首先我們要有行為數據,例如用户每天看 100 篇文章,有 40 篇是體育的,有 30 篇是汽車的,有 20 篇是旅遊的,還有 10 篇其他的。我推測,你比較喜歡體育、汽車、旅遊。
對於這樣的標籤,大概需要什麼流程去做呢?環節一很重要,內容標註。只有知道用户看的內容是什麼,才能統計偏好。環節二,如何基於用户行為做聚合統計和歸一化。
一個經典的標註例子:網頁標註
在做內容標註時,一般會有兩種情況:第一種:有些公司在建自有用户畫像時會很幸運,例如電商、視頻類、音樂類的媒體,它給用户服務的這些內容是已經分類好的。可以直接用內容的標註來做用户行為標註。
但是,對於一些通用型的內容,比如[友盟+]的數據,會有 PC 瀏覽數據、APP 的使用數據,一定要先了解用户喜歡看什麼,才能去做下一步的工作。在這裏面,最複雜,也最典型的就是網頁的內容標註。
標籤的最終生成:行為統計
根據用户的行為,統計標籤數值,歸一化。比如,我們判斷用户是喜歡運動、還是服飾,會將他看來多少相關網頁、使用了多少 APP 進行累加,在除以一個總累積,得到一個標籤得分。
這裏面有幾個點需要關注:
第一、統計量的選取。可能是瀏覽數量、瀏覽時長、瀏覽頻度、複合關係等。舉個複合關係的例子,對於某個商品類目的偏好,你可以將瀏覽、搜索、收藏,購買等行為統計量加權在一起考慮。
第二、個體內的可比性。個體用户的不同標籤間具有可比性。舉個例子,我有兩個標籤:閲讀、旅遊。我的閲讀標籤是 0.8 分,旅遊是 0.6 分,代表我更傾向於去閲讀,而不是去旅遊?如何保證這一點呢?在上面公式裏將個體的行為總和作為分母就可以了。
第三、垂類內的可比性。一個垂類內不同用户的相同標籤具有可比性。
例如,我的動漫得分是 0.8,你的是 0.6,表示我比你要更喜歡動漫。那麼分母就是選取整個動漫類行為的總和。比如説,今天全國用户在 B 站上一共 100 萬小時,你有 1 個小時,你是百萬分之一,他花了 2 個小時,大約是百萬分之二,最後再做一個歸一化,就會產生一個類內可比的得分。
我們剛剛説的是絕對化的值,還有一個簡單的做法就是做排序,基於用户的使用時間做排序,這樣也可以。
但是排序和歸一化到底有什麼不同?排序只代表相對性,而剛才説歸一化代表了強弱, 我的得分是 0.8 和你是 0.6,就表示偏好強度上我比你高了 30%,而排序則不能反映這樣的比例。
11、統計型標籤生產要點回顧
1、行為數據。瀏覽、使用、點擊、購買、LBS 等,通過行為數據反映人的偏好傾向;
2、標籤體系。根據實際需要進行設定。可以參考《消費者行為學》、電商類目體系、應用市場體系、媒體資訊體系等;
3、內容標註。把行為相關的內容抽出來做分析,把標籤體系先打到它們身上,再累積到「人」身上;
4、得分歸一化。明確歸一化的目標,選擇所需的歸一化方法。舉個例子,推薦適合用個體內可比較的得分,不管 A 看會某個內容用了多少時間,A 所看到最多的內容就優先推薦給 A,不用和其他人比較;
但在投放廣告上,就要考慮用户在這個商品上的傾向度有多高,需要用户間可比較的得分。
預測型標籤的生產流程
預測性標籤的生產流程:特徵抽取→監督學習、樣本數據→評估→標籤產出,這也是經典的機器學習流程。
特徵工程
特徵工程,是機器學習的關鍵過程之一。最重要的是提取不同側面的特徵。我們以移動端使用行為可抽取的部分特徵為例:
1、APP 使用事實特徵:用户 30 天內開啓 APP 的天數、用户 180 天內開啓 APP 的天數。這兩個數據都會作為特徵,考慮用户短期和長期的情況。
用户 30 天內使用 APP 時長佔比、用户 180 天內使用 APP 時長佔比。剛才説的是次數,這塊是時長,用户可能反覆打開,但是總時長很短。
2、興趣特徵:雖然信息有損失,但是泛化效果更好。舉個例子,你是 A 站用户,他是 B 站用户,理論上講,如果我們用最底層的數據,你們兩個人是不太一樣的,但某種程度上,他們都是對二次元感興趣的人;
近期用户興趣標籤歸一化值、長期用户興趣標籤歸一化值。用户長短期基於興趣標籤下使用不同 APP 的熵值、歷史某類 APP 時間消耗佔比變動比例。其實反映了我們要看這個分佈,以及分佈的趨勢性,你過去關注度高,現在關注度減弱,和你過去關注度不高,現在關注度高,其實這兩個是完全對應不同的人,這也是我們參考的特徵。
3、設備與環境特徵:近期使用的設備品牌、近期使用的設備型號;工作日時間段內 Wi-Fi 使用時間分佈、休息日時間段內 Wi-Fi 使用時間分佈(工作日與假日的區分)。
模型訓練與結果評估
1、模型選擇。有有監督的分類算法:邏輯迴歸、SVM、決策樹、Bagging、深度學習;
2、二分類 or 多分類。二分類比較簡單,多分類則有不同的拆分策略。舉個例子,把人分為男女,是二分類的問題;分為年齡段,就是多分類的問題,我們在機器學習當中也有不同的做法,OvO(一對一)、OvR(一對其他)、MvM(多對多)。
3、結果評估。評估指標包括:正確率、召回率、應用效果。但是對於統計型標籤來説無正確率,召回率看閾值,今天你只看一個汽車的型號,理論上我也可以給你打一個標籤,但是分值非常低,這個分值到底要不要算做這個標籤的人,要看中選什麼樣強度的人。預測型標籤,一般看 Precision,Recall,F-Score,ROC。
4、Ranking 任務。一類特殊的定製化標籤。針對特定場景,如對電話營銷需要按照可能性排序打電話。套用上述模型,可以用最終得分來做 Ranking。
15、關於標籤評估的延展
標籤的生產不是目的,使用才是。正確率≠效果,舉個例子:喜歡看車不代表是試駕購車的目前人羣。
第一,用户分層的評估。針對於重點人羣進行評估,不同人羣分層進行評估;第二,從全局進行評估。不要只侷限於樣本集合的評估,參看一些全局統計數據。例如,人口屬性的分佈和統計局的結果是否相符?第三,有效果反饋的應用。將標籤直接應用於使用場景中檢驗效果。例如,進行營銷的定向投放,測試點擊率;第四,利用其它數據佐證。使用其他行為數據來驗證標籤的有效性。例如,在電商環境中後續的行為差異來評估顯著性。
一個快速建模框架
我們今天不再強調標籤豐富度,而是快速建模的能力。快速建模怎麼做到?這套系統在[友盟+]比較完備,使得我們收到一個樣本就可以很快訓練模型,這個流程最快 3 個小時就能夠把標籤算出來。
用户畫像的應用
Data -> Insight -> Action->Data->…
第一步,先有數據,就像標籤生產出來,要有數據的過程;第二步,分析,洞察。洞察並不是最終目的,因為洞察只是得到一個結論或者方向;第三步,開始應用;應用後又帶來新的數據,從而形成數據的閉環。舉個例子,廣告怎樣的羣體點擊了,數據被反饋回來,下一個循環可以進行調整,不斷地迭代,優化整個效果。
DIP營銷服務流程
關於上述流程的實際使用,結合[友盟+]DIP 數據智能平台講一下營銷服務流程是如何做的。
左上面是我們一些數據,例如:客户上傳數據後,我們會有一個匹配的過程,把所有數據打通連接。上傳、匹配之後,會對這些數據做人羣分析。比如説寶馬 X1 今年剛上市,他們把去年購買 X1 的用户都上傳上來,我們會分析這樣的用户在哪些方面是有特性的,比如年齡段、地域分佈、收入、偏好。有了這樣的分析後,我們可以選擇相應的人羣,基於歷史的偏好、特徵,然後再去投放;如果中間我們會發現人羣量不夠,最初選擇 10 萬人可以放大到 100 萬人。最後輸出到媒體、RTB 等渠道商。做預算,看效果,將效果數據迴流,再去迭代,以進一步提高投放的精準率。這是我們常用的一個流程。
在舉個實際的例子,如果要做一個新產品的傳播推廣,這時需要做定向投放。我們先要對潛在用户要進行分析,例如對於科技產品非常感興趣的人,我們發現他每天 8、9 點特別活躍,通過進一步分析,他會和哪些媒體做觸達,或者他看不看電視會不會留意到地鐵裏面的廣告,這也是一個觸達渠道,以及看什麼樣類型的,看資訊、社交、八卦,這個不太一樣。要找到受眾,應該到哪找?比如説去這種有態度的網易新聞,還是個性化的今日頭條,或者説騰訊新聞,這都需要進行分析。
基於上面的分析之後,再做結合分析。舉個例子,你對科技感興趣,那你的手機是不是到了更新期,你手機大概用了三年,應該到了更新期,就可以對這樣的特定人進行投放。把人圈出來,投放、曝光,曝光之後我們去看營銷的結果,然後返回來繼續分析,會不會對其他內容感興趣,再去做下一輪分析。
這就是我們之前做的一系列方法的一個應用。
最後關於數據應用我再給出一些通用型的建議:
第一、分析:
1、結合業務場景去選擇分析維度:如果你是給中年婦女推薦保健品,你去分析她們喜歡不喜歡二次元,這就非常説不通了。
2、不要只是簡單的看畫像分佈,一定要做對比。
3、例如,與大盤對比情況:TGI。上圖是我們分析一個 APP 內的購買人羣。紫色的線是人羣的分佈,年齡段的分佈。我們看到 18-30 歲之間的人很多,感覺還不錯。但是,如果你做一下大盤情況,APP 的用户大多是年輕人,因為本身這個產品有一個年齡偏小的分佈特徵。通過分析對比之後發現,TGI 比較高是 30-39 歲的人,這個範圍的人才是在購買人羣裏面是顯著的,這個羣人才是你去做運營活動、投放的人羣。
分析,一定要去做對比,單純看分佈是並沒有太多信息含量。不對比看不出來差異。
4、環節的對比。哪些人我觸達了,哪些人到這裏落地了,哪些人註冊了、哪些人真正瀏覽、哪些是留存、哪些是付費,每一個環節你都可以做這樣的分析。
第二、精準投放(Action)。這是我們今天做標籤非常大的一類應用。這時候大家可能會發現,我們做品牌廣告、效果廣告是不同的,舉個例子,品牌廣告我們就會關心 TA 濃度,關注我投放廣告的人性別怎麼樣、年齡分佈怎麼樣。效果廣告是不一樣的,效果廣告通常很直接,你這個人是不是點了,最終 CTR 高不高,最終購買 ROI 高不高,這種一定是你最直接的興趣是什麼,你什麼性別不重要,我就想知道你要不要。
另外一點,直覺未必靠譜,一定要通過反饋來檢測,就是剛才説我們為什麼要數據閉環,比如説,有一個商品設計者説,我這個產品目標是吸引白領女性,實際上他上市場去賣的時候發現,買他的男性大學生最多,跟他想的根本不一樣。
如果你一直持續的給白領女性做廣告投放,實際上效果可能不是最優的,反而你做校園活動會達到更好的效果。
甚至説,你可以基於你的用户場景做專屬標籤,以及你可以通過人羣放大來做處理。舉個例子説,我今天有新的車型上市,一個方法是,先選取對汽車感興趣的人,或者 SUV 感興趣的人,就可以去做投放,這個效果就可能不是最優的,更優的情況是針對你這個 case,去針對性的做訓練,針對性的選取跟你相關的人,通常效果上比通用的標籤選取更好,這時候我建議如果你特別強調你的效果,就去試試訓練專屬的標籤。
更多詳細講解,請見知乎 Live
以上就是本次公開課的關鍵內容,更多演示請點擊「極客公開課•Live」第十四期查看獲取
(2017-09-22)
藝術家Bruce Mackley的驚人的作品,超過20,000張裝飾和框架螺絲的工業馬賽克,精心設置在不同深度的彩繪松木板上。這種3D藝術需要耐心和關注!稱重超過350lb,站立七英尺高。
去年在中西部藝術博覽會上首次登場,他發現它吸引了很多人,意想不到的人數。現在來欣賞一下他的作品吧!
(2017-09-15)
昨夜,江蘇蘇寧外援前鋒羅傑-馬丁內斯更新了個人Ins,他曬出了自己的漫畫版畫像,並秀了一把中文功底
在這張漫畫畫像中,R馬的形象充滿肌肉感,極為生動逼真,畫中還配文:“力拔千鈞、鋒不可擋”八個大字,將R馬在球場上的威武霸氣盡情彰顯。R馬本人對這張漫畫也十分滿意,他發佈Ins並用中文説道:“我很堅強,我要感謝上帝吧!”
在中國生活一段時間後,R馬的中文水平已經十分不俗,他在與粉絲互動時便秀起了自己的中文造詣,只是“讓八卦拉”的回覆不但讓外國友人一臉懵逼,還讓小編不知所云。
(2017-09-16)