解決數據安全問題,除了完善的法律法規,剩下的都可以交給科技。
2020,是個魔幻之年。從疫情開局,到各類“黑天鵝”事件,沒有人能遺世獨立。大小人物,都是人間煙火。世界日新月異,往往不會等你準備好了才開始改變。也許從細微之處,我們更能感受到這些改變對我們每個人帶來的真實影響。這,也是周觀新金融蒐集“金融煙火事”特輯的原因。
第三期,是一位數據公司高管的故事。近年來,他所親歷的數據安全行業To B格局劇變,到底“變”在哪裏?
從去年到現在,大數據行業經歷了翻天覆地的變化。身為行業的其中一員,我感觸頗深。去年底,魔蠍科技等公司被查的大數據風波,也是行業“劇變”的開始。
去年10月12日,北京銀保監局發佈了《關於規範銀行與金融科技公司合作類業務及互聯網保險業務的通知》,對轄區內的銀行與科技公司機構合作業務進行了詳細的規範,明確“不得將貸款‘三查’、風險控制等核心業務環節外包給合作機構;不得僅根據合作機構提供的數據或信用評分直接作出授信決策;不得因引入保證保險、回購承諾等風險緩釋措施而放鬆風險管控”。
這一波針對大數據的監管風波之後,無論是機構需求,還是數據公司本身的業務重心,都出現了很大的變化,“數據荒”出現了。
什麼是“數據荒”?數據就在那裏,卻很難用起來。很多數據公司開始擔憂以前“賣數據”存在的合規風險,與此同時,我們也清晰地感受到,所有的銀行機構開始忌諱數據出庫的建模方式。尤其是隨着5G的普及,國內的互聯網數據應該會以指數級的增速增長,數據的客觀存在與數據孤島效應成為一個矛盾。與此同時,很多金融機構的貸款業務都有KPI,不可能不放貸,也不可能不用數據,但數據使用的安全邊界卻依然不明晰,不知道如何使用數據才是符合要求的:既要用,又擔心。
基於此,在數據安全領域,銀行等金融機構的合作意願相比以往表現得強烈,需求也更加明確。過去,銀行似乎在數據的採購與業務建模上“以結果為導向”,關注的是哪家數據能解決風控中的實際問題。比如銀行和金融科技公司的聯合放貸,銀行側更多地是關心數據風控的效果。
但今年以來,由於國家對數據安全的法律法規更加明確,一大部分數據公司被監管整改,數據市場過去比較暴力的輸出方式逐漸被淘汰。銀行側由於內部數據監管更加嚴格,不存在任何樣本出庫的可能性。這種變化倒逼數據市場催熱了聯邦學習、邊緣計算等安全計算技術,越來越多巨頭在安全計算領域的投入也在加大。
銀行對數據安全的要求非常明確,銀行的用户數據不能出門,銀行去查詢第三方數據的時候最好拒絕用户ID被緩存,銀行對合作數據源要求一手合規。從銀行機構內部來看,數據安全類的合作也正經歷着“風格切換”:城商行表現“激進”,國有銀行正在“下沉”。換句話説,城商行股份制銀行則能更快地接受安全計算技術並付之於實際業務,國有銀行目前普遍處於立項科研階段。
營銷,用户運營是對銀行儲蓄卡、信用卡、理財、貸款等業務場景的用户進行量化分析,並作出運營決策,圍繞着以ABTEST為核心的運營思路,不斷優化運營方案,最終達到降本提效。銀行依賴於外部的數據進行用户興趣偏好的刻畫,比如支付維度數據、SDK行為數據、電商數據等。
風控,風控評分是對銀行信用卡、貸款等業務場景進行大數據智能風控,通過與多方數據進行聯合建模,建立用户信用評分卡與質量評估模型,提升信貸客羣的信用評估能力,最終降低信貸業務的壞賬率。比如小微企業貸,就涉及到外部的税務發票、水電費數據等。
傳統的方式是API將需要的數據從數據源那邊調用到銀行端,問題是去查詢存在被惡意緩存用户ID的隱患,另一個問題是採購標籤如果是脱敏的太多,意味着價值越低(數據源也開始忌諱直接輸出原始標籤)。目前,聯邦學習等隱私計算解決方案之所以流行,就是可以保證雙方數據不泄露,最大化地聯合多方數據源進行模型訓練,保證了雙方數據的安全性。
實際上,要徹底解決行業的數據安全問題,需要雙管齊下。首先,要有完善的法律法規,然後,剩下的問題都可以交給科技。
近日,《數據安全法(草案)》已經比較明確規定了數據合規使用的邊界,我相信未來關於數據安全的法律環境會更完善。而從科技公司未來的發展來看,我建議可以更多地考慮從技術上去解決使用數據過程中同時能保護數據安全的問題,比如目前比較被公認的隱私計算技術,市場上已有這些技術在信貸業務的落地應用。
未來,我認為在數據安全領域,To B科技服務也會經歷“萌芽、迅速繁殖、泡沫、淘汰、慢牛”的生命週期。而目前的安全計算,還在萌芽過度到迅速繁殖的階段,我們可以看到越來越多的科技公司參與到這條賽道,應用的領域也比較集中,主要在風控和營銷等。
在這個階段,更艱鉅的突破是技術和產品打磨上。改變以往比較暴力的數據行業模式,我覺得未來整個數據行業的價值會從“拷貝貶值”變成“越用越值錢”。相應的,這個行業能存活下來的企業,未來寡頭效應也會更明顯,估值也會很高。