開源網絡數據體量巨大,佔到整個數據量的95%以上。這些海量的數據往往隱藏着一些其他數據所不具有的可以解決特定問題和重大問題的關鍵信息
“開源網絡數據是沒有國界的重要戰略資源,我們不用,人家要用,我們落後,就要捱打。”
文 |《瞭望》新聞週刊記者 蘇會志 張冉燃
自數據首次與土地、勞動力、技術、資本等傳統生產要素並列,數據資源正加速向新型生產力轉化。
數據開發利用和數據應用服務,是將數據價值轉化為生產力的最重要途徑之一。業界認為,數據應用服務產業是實現數據要素對其他要素倍增效應的重要依託,將極大提高生產力發展水平。據預測,數據應用服務產業近期市場規模將達數十萬億元。
傳統的數據應用大多是對單領域、單類別、單結構數據進行的採集、統計和分析,應用侷限較大。更好地釋放數據紅利、實現大數據普惠服務,不能忽視人人可用、無所不包、相比其他數據要素更公平和豐富的開源網絡數據。
開源網絡數據即在互聯網中公開的數據,包括政府公開的經濟統計數據、交通數據,法人公開的銷售、管理數據,及大量互聯網用户留下的行為、社交等數據。因在網絡空間中隨時隨地自然生成,也被稱為“野生數據”。
開源網絡數據是大數據的主體。但在我國,開源網絡數據的挖掘應用尚如待開墾的處女地。成都數聯銘品科技有限公司(下稱數聯銘品)董事長曾途強調,大力培育數據應用服務產業,是充分挖掘數據特別是開源網絡數據的巨大價值、推進數字經濟的供給側改革和增強國際競爭力、搶佔戰略制高點的當務之急。
“野生數據”價值大
不久前,中國原最大連鎖咖啡品牌瑞幸咖啡因遭遇著名做空機構渾水公司做空,從美國退市,為中概股企業敲響了警鐘。
近期,從事大數據應用服務的頤信科技有限公司(下稱頤信科技),接到一個客户委託——調查某做空機構是否涉嫌惡意做空在香港上市的某生物科技有限公司。但委託方提供的已知信息,僅有一篇談及該公司存在造假嫌疑的新聞報道,線索非常有限。
在各種數據匱乏的情況下,頤信科技專業分析師通過查找該新聞中提到的做空報告、文章作者透露的其他淺層次信息,不斷深挖該做空機構的開源網絡數據,並運用專業技術和手段,對相關海量數據進行關聯分析,求證研判,查實真相,一步步勾勒出了該做空機構的全貌,獲得了該做空機構創始人的海外背景、個人言論、社會關係等關鍵數據信息。分析師還研究了該機構此前針對多家中概股公司的做空報告,從多層次、多角度、多維度分析研判、比對佐證,最後得出該做空機構報告內容不實、惡意做空中概股企業的結論。為穩定中概股企業海外融資環境、解決信息不對稱作出貢獻。
全國信息安全標準化技術委員會委員、頤信科技董事長黃勁告訴《瞭望》新聞週刊記者,本案的關鍵,就在於深入挖掘調查對象的開源網絡數據,這些數據大大超越了公權機構數據、法人私有數據的信息量,體現了開源網絡數據的應用服務在解決信息不對稱問題中的巨大優勢。
相比於較為“封閉”的公權機構數據、法人私有數據,開源網絡數據具有無組織性、無既定目標、無人管理、海量化、碎片化等鮮明特徵,它的開放性、包容性、實用性、及時性等特點,使之成為大數據的特殊存在,能較準確、較全面地反映社會動向及人物、組織、事件的真實動態。
據權威機構統計,開源網絡數據體量巨大,佔到整個數據量的95%以上。有關專家表示,這些海量數據往往隱藏着一些其他數據所不具有的可以解決特定問題和重大問題的關鍵信息。只要開發利用得當,就能產生巨大價值。
例如在政府治理上,監測預警重大社會事件,提高政府治理現代化水平;在金融風險防控上,以實體經濟監測為基礎,排查金融機構風險,提高信息透明度;在公司治理上,運用開源網絡數據進行客户背景調查、項目風險調查等,為企業決策提供參考;在中小企業服務和公眾服務上,使小微主體也能掌握數據資源,享受數字紅利。
運用開源網絡數據查實被調查對象的債權債務情況,深度挖掘其隱匿資產、關聯資產以及財產轉移等線索,可提高不良資產回收精準度和催收效率
“我們落後,就要捱打”
開源網絡數據向所有人開放,但任何人都不可能輕易獲得所有想要的數據,更不可能壟斷全部開源網絡數據。開源網絡數據的應用需要專業機構、專業團隊提供專業服務。
開源網絡數據應用服務在西方發達國家已經得到比較普遍的認可和應用。有專家援引美國某核心情報機構統計稱,僅佔情報經費支出5%的開源網絡情報,為其最終的情報產品作出了80%的貢獻,現在,其情報有70%以上是開源網絡情報。歐美多國相繼成立相關研究機構和應用開發中心。
隨着全球範圍內大數據產品和服務的不斷完善,一批有實力的大數據創業公司湧現出來。例如,Palantir自2015年起就成為全球估值第一的大數據企業,它的重要客户為美國情報機構,業務主要涉及國防安全與金融領域等。
在中國,經過數年發展,大數據技術和應用經歷了從萌芽到野蠻發展,再到激烈競爭和重新洗牌的不同階段,湧現出頤信科技、數聯銘品等一批大數據應用服務企業。
以頤信科技為例,該公司通過技術研發和業態創新,建立了業界先進的數據應用服務基礎理論架構及實踐成功的多場景、多模式應用體系,創建了數據融合分析系統和開源數據分析師團隊,擁有多項國內外先進的核心技術和知識產權。
數聯銘品則是國內較早探索和實踐大數據技術和數字經濟產業發展的高新技術企業之一。以監管領域為例,數聯銘品研發的新金融大數據監測預警平台服務於北京、上海、貴州等全國20餘個省市金融監管部門,對非法集資等金融風險提供事前預警。截至今年8月底,共監測新金融企業300餘萬家,提示高風險企業5萬餘家,與合作的監管部門共同預警定位高危風險企業800餘家。
但總體而言,我國數據要素價值向現實生產力的轉化尚處於初始階段,開源網絡數據應用在我國剛剛起步,從事的專業企業數量少、規模小。
這讓黃勁充滿緊迫感,因為“開源網絡數據是沒有國界的重要戰略資源,我們不用,人家要用,我們落後,就要捱打。”
短缺的“擺渡人”
在業內人士看來,開源網絡數據應用不足的原因主要有二:
一是對開源網絡數據價值認識不足,以為通過搜索引擎獲得的表網數據就是全部,不知還有95%的數據隱藏在深網中;或者以為開源網絡數據僅供參考,不知運用專業方法和手段可以查實真相;又或者以為數據只有統計價值,不知還有專業的數據價值挖掘。
二是對開源網絡數據應用能力不足。開源網絡數據應用的關鍵在於知識提取和價值挖掘,其中思維比手段更重要,人才比機器更重要。國內對開源網絡數據的應用大多還停留在數據存儲檢索和提供基礎輿情分析階段,關鍵技術和人才缺乏,直接導致應用受限,發展受阻。
業內人士分析説,數據的處理分析要求精準可靠,僅有人工智能技術還遠遠不足以支撐調查,經驗豐富的專業分析師的智能作用更大。機器只能發揮20%的基礎性作用,80%深層次的高端工作要靠專業分析師來完成。
數據分析師也被稱為數據信息和智慧之間的“擺渡人”。專家認為,數據分析師的工作具有高度專業性,不僅需要數據技術使用能力、多學科知識儲備及應用能力,更需要想象力、洞察力、推理能力和紮實的知識儲備。一名優秀的數據分析師一定是高端複合型人才。
在我國,包括數據分析師在內的大數據人才短缺問題一直存在。工信部印發的《大數據產業發展規劃(2016—2020年)》指出,大數據基礎研究、產品研發和業務應用等各類人才短缺,難以滿足發展需要。
而據保守估計,全社會需要的專業數據分析師人才約200萬人,缺口很大,高端數據分析人才更是鳳毛麟角。
這意味着,我國亟需加快數據應用知識普及,支持專業機構開展培訓並提供實戰機會,鼓勵高校開設數據分析、數據應用等專業學科,以教育培訓為基,以實戰演練為本,持續培養高端數據分析人才。
大數據精準穿透式監督產品不僅能夠充分挖掘企業之間的投融資、上下游、擔保、一致行動及家族企業等關聯關係,還能通過其原創的 AI 算法有效捕捉企業間重要且隱蔽的關聯風險,識別出隱匿的實際控制人與關鍵關聯方,為銀行的貸前和貸後提供高效的風險指引。
一家地方商業銀行利用BBD的大數據和人工智能分析技術,對信貸申請企業進行盡調。銀行通過大數據穿透式監管產品深度探尋算法,識別出與目標企業有強關聯的關聯企業或自然人,其中存在隱匿的實際控制人或關鍵企業。
不給信息泄露可乘之機
為更好發揮數據價值,加快數據特別是開源網絡數據應用服務產業健康發展,業內專家提出3點建議:
一是規範數據市場環境,維護市場公平競爭,充分發揮專業民營力量的各種優勢,加強政策支持力度,持續引導各類數據要素向先進生產力集聚。
二是推動我國數據應用服務理論創新、技術創新、應用創新、服務創新、模式創新,提高各地區、各部門、各領域、各行業對該領域的認知水平。
三是建立健全相關法律法規,明確數據產業法律紅線,對侵犯隱私等違法違規行為零容忍,依法依規開採和利用數據,持續優化行業發展環境,有效帶動數據在經濟建設和社會發展中的廣泛應用,真正使數據紅利普惠全社會。
其中,開源網絡數據開放、海量的特點讓數據安全尤顯重要。曾途強調,運用開源網絡數據必須依法行事。
如果對用户信息安全不夠重視,不但給信息泄露留下可乘之機,甚至會出現監守自盜的情況。目前,不法商家利用爬蟲軟件竊取和販賣個人信息的情況屢見不鮮,不但涉足現金貸、暴力催收等業務,甚至還牽扯暗網交易。被無意或刻意泄露的數據最終成為眾多不法分子、廣告運營商、中介公司甚至是詐騙團伙牟取暴利的手段,損害經濟健康發展。自去年9月起,多家大數據公司接連被查、業務暫停,甚至有些徵信公司也牽涉其中。
侵犯隱私、數據濫用等問題的出現暴露出兩個問題:其一,企業對合法數據獲取能力的不足;其二,當前法律底線尚不夠明確。
顯然,加快數據安全法律體系的建立,明確數據產業法律紅線,對優化大數據行業環境,推動數據共享,促進數據經濟發展具有重要意義。
今年6月28日,數據安全法草案在十三屆全國人大常委會第二十次會議上提請審議。
在業內專家看來,數據安全的根本目的是保障數據開發利用和產業發展,要在數據開發利用和產業發展中不斷完善數據安全的法律法規和實施細則,切實保障數據市場和數據產業健康發展,防止片面強調管理而影響發展的傾向,從而落實國家推進政府數據開放共享、提升社會數據資源價值,以及加強數據資源整合和安全保護等要求。
“相信數據安全法的出台,將在促進數據開發利用、保障數據安全、維護國家主權、實現數字化發展方面發揮重要作用。”黃勁説。□