沒有一條真理,可以解決人生所有的難題;也沒有一項技術,可以幫助一家企業所向披靡。
金融科技行業,縱使是一個簡單的項目,也需融合算法、專家經驗、工程部署、接口打通等一系列環節,才能完成一套解決方案,遠不止一項單點技術就可以“打包票”。
在這個過於信仰技術的時代,知道技術能做什麼固然重要,知道它不能做什麼也許更重要。
為此,雷鋒網《AI金融評論》策劃了「AI能否解決金融剛需問題」系列選題,借同一個話題,對不同背景的受訪者、產品和客羣各異的企業們進行採訪,期望在不同的商業和技術認知下捕捉觀點碰撞的火花。
在前三篇採訪中,我們採訪了冰鑑科技CEO顧凌雲、慧安金科CEO黃鈴、品鈦執行副總裁李惠科。
本系列的第四篇文章,由邦盛科技執行副總裁王雷講述他從事「AI金融風控」多年旅程中經歷的有趣故事。
以下為王雷的親身經歷:
“頭疼”的難題
一直以來,銀行對「信用卡套現」的行為都十分頭疼。
信用卡,本質上是一種貸款。銀行希望貸款用於消費,而不是炒股、炒房甚至賭博。但是,現實生活中,很多人並沒有合規地使用這筆錢,從而衍生出了「套現組織」。
對於銀行來説,信用卡里的錢如果不是用於消費,而是用於投資、賭博,一是增大了這筆錢不能返還的風險,二是違背了國家的貸款政策。
所以銀行會通過一些技術手段,對套現行為進行識別、監測。
邦盛科技之前就接到一個國有大行的訂單,他們本身有一個在風控領域積累了很長時間和經驗的優秀團隊,但是還是希望在這個基礎上更上一層樓,於是找到我們,希望通過金融科技公司的AI能力,引入解決問題的新思路。
當時,這家銀行已經能很好地識別出哪些個體的行為屬於騙貸,但是對於那些變化多端、組織嚴密的“專業”騙貸團伙,還是有些束手無策。
在項目初始階段,客户對我們的期望很高,認為我們一定能通過更先進的技術和方法,通過對個體騙貸行為的分析,找到某種聯繫,識別出詐騙團伙。
那會兒,其實許多機構還沒能達到這樣的水準,即使是行業裏最好的金融機構投入了大量精力,也沒能十分精準的識別出這些詐騙組織。而我們又處於創業初期,經驗匱乏,當時並沒有信心能完成這個任務。
當然,有沒有信心和做不做,是兩碼事。我們決定接受這個挑戰。
一口氣“抓”了幾千個犯罪團伙
樣本,是智能風控想要發揮作用的重要前提。
想要通過AI識別出詐騙團伙,追本溯源,還是得從高質量的樣本入手。
而樣本的質量高低,很大程度上依賴於專家的經驗。在風控領域,專家的經驗是比AI能力更稀缺、更重要的資源。比如薅羊毛是怎麼薅的、什麼樣的行為是薅羊毛,專家會通過多年積累的經驗和規則去識別哪些行為是“薅羊毛”、哪些行為屬於盜卡、哪些是洗錢、哪些屬於申請欺詐等等。
我們團隊中的優秀專家對這家銀行的樣本進行了分析,發現它們的樣本質量不是非常好。
於是專家們通過在風控領域多年的經驗,對樣本進行了加工,獲得了一些我們認為比較好的樣本。在此基礎之上,我們使用了機器學習建模平台和關聯圖譜平台,把可疑的個人和團伙都甄別出來。
那次,我們團隊幾個人在兩個多月的時間裏,揪出了大幾千個「信用卡套現團伙」,幾千個賬户,並查出幾十萬張有問題的信用卡。
經過那段時間的不斷探索後,我們對整個行業的理解有一種豁然開朗的感覺。
之前,我們在沒有開始做“識別套現團伙”的工作時,認為這是一件很難的事。但下一次在做其他的事情,我覺得是可以解決的,而且思路非常清晰。
其實,那次項目因為涉及到的銀行體量非常大,我們面臨的風險和壓力也非常大。
但是我們頂住了壓力,積累了許多欺詐團伙的特徵和畫像,並對模型進行進一步的優化。
後來這家銀行通過我們提供的線索進行了調查,確定了這些人的確屬於套現團伙,並降低了他們的信用卡額度,並對部分信用卡進行鎖卡處理,效果非常好。
也是因為這次經歷,我對AI在「風控領域」的應用價值,有了更直觀的認識,使得我對AI在風控場景下的應用,更加有信心。
如今,邦盛科技為這家國有大行做了一個更大的項目,一個包含申請反欺詐、電子渠道交易反欺詐等全方位、全行級的反欺詐系統。
而“識別套現團伙”成為了整個大型項目中的一個組成部分,繼續為這家銀行提供服務。
抓住銀行的心
思之所想、解其所憂,才能抓住一個人的心。
同理,想要獲得銀行大單,首先要認識它,然後解決它做夢都想解決的問題。
在和銀行客户打交道時,不一定所有時間、所有產品,它都會覺得滿意。這時,我們需要對項目的效果進行量化,沉浸到它的角度思考問題,讓它信任你。
因此,我們會時時刻刻追蹤AI產品的效果,並制定一系列可以看得見、摸得着的指標,讓它對我們工作的效果有一個清晰的認識,建立信任感。
比如攔截非法金額數目、對客户的干擾率程度、風險等級,我們會把這些有關風控的數據或者結果記錄下來,作為統計最終模型好與壞的一個標準。
我們一般建議客户,三個月或者是六個月調整或者優化一次模型。頻繁的調整,不是銀行的風格。
對於銀行等金融機構來講,“穩定”壓倒一切,其次才是改善。所以,他們對新技術的應用也是比較謹慎的。
銀行不會輕易改變自己現有的風控方法,因為改變意味着不確定的風險。只有觀察到技術和效果真的十分穩定,他們才會採用新的技術系統。
AI在信貸領域主要防控兩種風險,一種是欺詐風險,另一種是我們常見的信用風險,比如我們年輕人十分熟悉的“芝麻信用”和“微信支付分”。
一筆貸款的發放,銀行得先判斷它是否是有欺詐的風險,然後再判斷它信用風險的高低。
首先,金融機構最擔心的事兒是被騙子欺詐,把貸款放給了騙子。
當通過反欺詐技術將騙子拒之門外後,銀行還要擔心普通人能否正常還錢。普通人也有可能因為做生意經營不善、丟了工作或者社會環境的改變等因素,還不上錢,所以要判斷他們的信用風險。
在評估信用風險上,「評分卡模型」是可解釋性非常好、也很穩定的一個模型,現階段也使用的非常多,各家銀行都是比較習慣使用這種傳統的方式。所以,我們在這一領域,需要我們金融科技公司技術能力的場景並不多。
而在反欺詐領域,越拉越多的金融機構開始接受機器學習模型。因為欺詐行為更具有隱蔽性,欺詐風險比信用風險更難以控制。
而且業內一般需要六個月來訓練控制風險的模型,上線模型至少又得三個月,加起來就是九個月。在這段時間裏,整個市場的欺詐形式是會發生很大變化的,欺詐團伙發現金融機構會欺詐行為進行防控後,他們還會變換手法。
針對這樣的情形,邦盛科技專門在模型訓練中設立了一個環節——特徵工程。在這個環節中,我們儘量呈現出更多的特徵,我們將幾千到上萬個特徵輸入到一個模型中,使它覆蓋更多的可能性,雖然不能徹底解決問題,但通過這樣的算法調優,欺詐行為的成本會越來越高。
此外,銀行需要考慮自己所用的技術,是否符合監管政策的要求。
機器學習這類技術,最大的一個問題是不透明、不可解釋。它使用的是非線性的算法,當模型説貸款可以放,但是它推理的過程是不可逆、也不可用文字解釋的,這樣在使用過程中就會受到一些限制。
模型本身是一個算法的配合,我們也在嘗試通過一些技術方式,來增強模型的解釋性。
AI不是萬能的
邦盛科技從創業初始,到如今與中國農業銀行、中國建設銀行、招商銀行等多家國有大行合作,對行業的理解也是經歷了一個從無到有的過程。
但是AI也存在很多不能解決的問題。
剛剛提到AI風控效果的好壞取決於樣本。在欺詐等場景中,樣本天然比較充足,而信用卡盜刷、賬户盜用等場景下,因為銀行的防控力度比較強,發生的案件數量較少,能積累到的樣本也就較少,使得智能風控的效果也是參差不齊。
現在,機器學習和AI應用在金融的各個領域都在嘗試,但是每個銀行對樣本積累的重視程度也不一樣,所以有的做的比較好,有的做的一般。
目前我們對樣本的依賴程度過高,所以業內很多公司也都在嘗試無監督或者半監督的技術方式。
有監督就是有樣本,無監督就是無樣本,半監督就是樣本質量不夠高。
有監督的樣本,是團隊從業務中一點點積累下來,通過規則體系和專家經驗,輸入到模型,然後模型跑起來。
採用無監督的方式,一般是因為團隊沒有積累樣本,又沒有這個領域的專家,於是依靠純粹的算法,通過聚合量、聚類等數理關係,找出高風險的金融交易,提取這些異常的樣本後讓專家判斷。無監督的流程是先通過模型得出結果,讓人來判斷,然後模型再根據人的判斷的結果去優化。
在實踐中,我們不管用哪種技術方法,我們都會建議客户採用綜合的解決方案,而不是單一的AI產品,這套解決方案包含着專家經驗、規則體系、模型體系、圖譜體系、大數據計算等,這些元素必須結合在一起才能形成解決問題的合力。
社會上大部分的問題本身,都是一個很複雜的東西,它需要系統化的思路方法和技術才能解決,我們不能單一地認為依賴於某一個高新技術就能解決所有問題。
我們每年會招很多新人進來,也會接觸到很多新入行的創業者,我整體的感覺是,大家有點過於迷信技術,迷信高端的算法。
任何一個技術的應用,都有前提條件,比如數據環境、樣本質量。每一次對AI模型的調整,少則三個月,多則幾年,運營的成本也非常高。
如果環境條件不允許,技術就很難達到大家期望的狀態。
所以對於很多這些新入行的優秀人才,我建議先對這個領域有一個比較深刻的業務理解,看看沒有能力給技術創造出一個好的環境出來。
沒有對業務足夠深刻的理解,不能把沒有達到期望的數據轉化成高質量的樣本,模型很難運轉起來。
雷鋒網雷鋒網