編輯導語:資料的時空觀是我們認識資料價值的一種新角度,它研究的是資料在時間和空間兩個維度上的價值規律與作用機制,那麼該如何理解資料的時空觀?本文作者基於資料的時空觀問題展開了分析,看看如何才能從時空觀中看出資料的取捨之道。
之前談過資料的價值觀,今天想談一談資料的時空觀。
說到時空觀,好像也是大資料領域比較忌諱的。因為一說到時空觀就要扯到相對論了,在大資料領域來聊相對論的話題,大部分專家是不敢搬起石頭砸自己的腳的。
沒關係,反正筆者是大資料領域的一個小角色,胡說八道的聊幾句,也不會掉自己的身價。
所以,今天筆者就打腫臉充胖子,在這裡說說自己對資料時空觀的理解。
一、什麼是資料的時空觀開門見山,先說說什麼是資料的時空觀。
筆者認為:資料的時空觀是關於資料在時間和空間兩個維度上的價值規律與作用機制的基本看法與認知。這裡提到的資料是一種寬泛的說法——既包括傳統的結構化資料,也包括音影片、文字等非結構化與半結構化資料。
由以上定義可知,資料的時空觀要研究的是資料在時間序列和空間位置上價值變化規律。
時間和空間本身就是人類認知世界經常分析的兩個維度:時間和空間一方面可以對應到資料的縱向深度和橫向廣度,另一方面還可理解為資料在三維立體世界中的生命力,資料的時空價值本身就是資料生命力的體現。
二、如何理解資料的時空觀1. 資料的時間觀:資料是有溫度的時間賦予資料以溫度。
絕大部分資料是有時間上的延續性的,隨著時間的推移,資料的溫度或熱度也隨著變化。越是久遠的資料,其“體溫”就越低,而此時此刻的資料則是鮮活的,新鮮出爐的資料就有較高的溫度。
企業根據資料的溫度差異,可以對不同溫度的資料進行差異化處理。
比如:在使用者畫像領域,可以將使用者的資料分為冷資料、溫資料和熱資料三種類型。
- 冷資料:一般指三個月前的資料,這些資料通常比較穩定,長期以來不怎麼變化,例如:年齡、性別、常住地、職業等;
- 溫資料:指近三個月內的資料,是半冷不熱的資料,比如:近一個月下載過哪些APP、玩過哪些遊戲等等,這些都是具有一定時效性的資料;
- 熱資料:指實時的資料,即此時此刻使用者在做些什麼,這些資料都有極高的時效性,把握這些熱資料所產生的商機往往能考驗企業與個人的靈敏度和實時營銷能力。比如:對於滴滴司機來說,搶到更多的實時訂單就意味著空載率越低,其在單位時間內的運營效率就越高,實時訂單就是熱資料,司機獲得高價值的熱資料越多,也就能賺到更多的錢。
商業領域,資料價值一般隨著時間的流逝在衰減。
艾賓浩斯遺忘曲線告訴我們,遺忘是人類的天性,時間越久遠的事物,人類大腦能記住的就越少。
而在商業領域,隨著人類採集和儲存資料的技術日益成熟,資料儲存成本的快速降低,需要人類大腦記住的資料反倒越來越少了,資料的記憶工作大部分都交給了電腦、雲盤、伺服器等工具。
隨著時間的推移,資料量在增加,資料儲存成本也在增加。
但是,從資料價值的時效性來看,越是新鮮的資料其價值一般會越高,而同樣的資料如果是半年前的,那麼其價值就會大打折扣。伴隨著時間的流逝,資料的價值一般呈衰減態勢。
在某些特定領域,時間能為資料主體帶來增值。並非在所有的領域,時間都會讓資料及其主體的價值產生衰減效應。
比如:一些古董或考古文物,對於此類物品有濃厚興趣的玩家,其年代越久遠,物品的價值就越高。
資料此時雖說只是一種記錄或者證明,但是資料珍藏的時間越長久,承載資料的主體其稀缺度就越高,在市場上的估價就越高。
再比如:在很多懸疑偵破類電視劇中,很多歷史上的案件因為缺乏實際有效的證據而被擱置為懸案。此時歷史上的證明資料,可能就是一段影片檔案,這些影片資料的資料因其重要性和難獲得性,其對於案件偵破的價值就顯得非常高。
當然,還有一些經典的影像資料、音樂作品、藝術作品等,這些作品及其所承載資料也是隨著時間的流逝而會呈現價值增值的。
資料的時間價值是相對的。
價值本身是一個相對的概念,資料在時間維度上的價值也是相對的:一方面與資料本身的價值有關,另一方面也與個人或組織對於資料本身的感知有關。
資料的時間價值是有人文情懷在起作用的,所謂“如人飲水,冷暖自知”,同樣是一段小時候的個人影片記錄資料,每個人在不同的年齡段去開啟觀看時,可能會有不同的體驗。
所以,對資料價值的體驗與個人或組織的經歷、狀態等都有關係,資料的時間價值因人而異、因事而異。
2. 資料的空間觀:資料是有親疏度的空間賦予資料以距離感和親疏度。
按此角度,資料可粗略分為:遠距離資料和近距離資料。
同樣的資料對處在不同空間位置下的企業或者個人,其影響度是完全不同的。一般來說,距離越遠,資料的鴻溝越大,資訊的不對稱就越嚴重。
具體來說,資料在空間上的變化體現在兩個方面:物理距離和業務距離。
1)物理距離
指在地理位置上或者經緯度上的差距,這個是在客觀世界裡的真實存在的距離。
比如:如果你身在新疆地區,同樣是新增10個新冠肺炎確診病例,在新疆地區的人對這個資料的感受與身在北京的人是不一樣的,對於身在疫情重災區的美國的留學生來說更是不一樣。
可見,資料所反映事物的影響力與我們當前所處的空間位置有一定的關係,當然也與接收資料的主體對事物的關心程度有關係。總體趨勢是物理距離越近,資料的價值或影響力就越大。
利用物理距離可以圈定電子圍欄,鎖定圍欄中的目標使用者可以進行精準“打擊”。
比如:美團和高德地圖軟體中都有“附近”這個選項,進入其中就能發現距離當前位置最近的商戶資訊,此時如果客戶有訂餐或就餐需求,就可以選擇距離較勁的、符合自身口味的餐廳去就餐。
同樣道理,美團或高德也可以在APP端推送餐廳的資訊給圍欄內的客戶,為平臺上商戶進行引流。
物理距離越近,與客戶越親近,為客戶提供的服務就越容易獲得,客戶消費就越便利,這對平臺、商戶和客戶都是有好處的,這其中資料實際上拉近了商戶與客戶之間的物理距離。
資料離客戶或商家越近,其價值就越高。
2)業務距離
一般是指商業領域裡資料與業務之間的距離,更具象化的說法是某項指標如果屬於前端業務領域的,那麼它就離業務比較近,如果屬於後臺部分的,那麼它可能離業務的距離就比較遠。
比如:訂單量、銷售額這樣的資料離業務比較近,對業務人員的價值或影響力比較大,而員工在職人數、會議次數等資料則離業務比較遠,對業務人員來說沒有多大的價值。
一般來說,某項資料離實體業務越遠,其在企業內的重要性就越低,其價值也就越低。
在某些領域,物理距離反而能增加事物的神秘感和探索價值。都說距離產生美,有時候距離也能產生價值。
比如:對於太空迷和天文學家來說,遙遠的太空和外星球是很有吸引力的,有關外太空的深度資料因其稀缺性和難以獲得性,對於太空迷和天文學家是很有價值的。
所以說,在太空探索等特殊領域,物理距離是無法逾越的障礙,但是物理距離反而可以增加太空的神秘感和探索價值。
藉助AR/VR技術可以縮短外太空與人類之間的距離,讓我們能產生身臨其境的感覺。可以預見,在5G與AI技術加持下,物理距離將不再是限制事物釋放資料價值的障礙了。
3. 資料價值的轉換:以時間換空間時間和空間本身是資料的兩個維度。
在現實生活中,實現物理空間的跨越往往需要時間,而資料從一個位置傳送到另外一個位置時通常是瞬時完成的。
所以,資料可以節省現實世界裡實體的空間變化所耗費的時間,也就是用時間換取空間,資料給到了合適的人手中,物理空間上完成了轉換,資料價值也完成了傳遞。
用時間換取空間的例子很多,比如在泰國高分神劇《天才槍手》中,小林想到的跨時區作弊方法,就是利用了SAT考試在不同時區的時間差,在這個時間差內完成考題答案(資料)的空間傳輸。
小林先去澳大利亞參加考試,把所有的考題和答案背誦下來,然後透過藏起來的手機將答案(資料)傳送,老闆們透過鉛筆來把答案帶進考場鉛筆上有不同的條形碼粗細代表各不同的選項,而旁邊的數字就是填空題的答案。
一場完美的作弊就是這樣完成的,雖然實際執行過程中出現了一些意外情況。
總之,資料價值可以實現時間和空間的轉換,資料在時間維度的價值可以轉化為在空間維度上的優勢。
在適當的場景下,空間維度的價值也可以轉化為時間維度的價值,這就是資料價值在時空上的統一與轉化。
4. 資料的時空互動:價值的具象化與資料視覺化資料同時在時間和空間上的積累,最終能演化出什麼樣的價值呢?
筆者認為,資料在時空上長期的積累至少能證明我們做事情的專注和堅持,這無論對個人還是企業來說,都是一筆可貴的財富,世上沒有白走的路,每一步都算數。
正如《西遊記》中唐僧不遠萬里赴西天取經,正是因為佛祖看到了唐僧師徒經過了九九八十一難的資料積累,正是因為佛祖看到了唐僧師徒四人17年(時間資料)跨越了千山萬水(空間資料),才最終給唐僧下發了經書,唐僧等人才得以修成正果。
在《西遊記》中,資料在時空上的價值得以具象化,最終換取了佛經和正果。
資料同時在時間和空間維度上都有變化時,資料將呈現怎樣的狀態呢?
此時,資料視覺化將會告訴我們答案。
- 從時間上,資料視覺化技術可以呈現資料在時間維度上的變化軌跡;
- 從空間上,資料視覺化技術將為我們呈現資料在不同位置的浮動和湧現。
比如:天氣預報充分融合分析了天氣相關指標的時空特性,是時空大資料產品的典型代表。
三、從時空觀看資料的取捨之道綜上所述,資料從時間維度來看是有溫度的,從空間維度來看則是有親疏度的。
通常情況下,資料離我們的時間越長,離我們的距離越遠,資料的價值就越低。由此,引出了另一個話題,那就是資料的取捨。
既然資料的價值跟時間和空間有關係,那麼那些時間上離我們很久遠的、距離上離我們比較遠的資料就是垃圾資料,也就是價值不大的資料,這些垃圾資料經年累月的積累下來,就會佔據大量的儲存空間、耗費大量的儲存成本。
在資料爆炸的今天,我們應該學會對資料進行適當的取捨了,是時候要放棄一部分低價值資料了。
對於企業來講,做資料資產管理不可貪多求全,適當放棄低價值資料方是正途,建議企業應該更加重視與業務距離較近的熱資料,而對與業務距離較遠的、非熱資料應採取有選擇性的放棄策略。
四、關於資料的時空觀的小結資料的時空觀是我們認識資料價值的一種新角度,它研究的是資料在時間和空間兩個維度上的價值規律與作用機制。
時間賦予資料以溫度,將資料分為冷資料、溫資料和熱資料。
從資料價值的時效性來看,越是新鮮的資料其價值一般會越高;空間賦予資料以距離感和親疏度,將資料分為遠資料和近資料,總體趨勢是物理距離或業務距離越近,資料的價值或影響力就越大。
資料在時間上的價值與空間上的價值有時是可以相互轉化的——資料價值在時空特性上可實現統一,可以具象化和形象化。在資料爆炸的時代背景下,企業應懂得資料的取捨之道,學會有選擇性的放棄低價值資料。
以上就是我對資料時空觀的粗淺看法,我在這裡等候各位專家拍磚過來。
擴充套件閱讀:我的資料價值觀:是什麼?有什麼價值?如何產生價值?
作者:黃小剛,微信公眾號:大資料產品設計與運營
本文由 @黃小剛 原創釋出於人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基於CC0協議