撼山易,撼「AI金融」難
它看準了金融行業數字化程度高、歷史數據準確等特點,像熔漿一樣無孔不入的流進金融的各個業務中,並給它們燙上了自己的烙印:智能投顧、智能風控、智能營銷、智能客服......
但同時,很多人也在質問它是否名副其實。國內好的智能投顧產品幾乎為0,智能風控的效果太過依賴樣本,智能營銷推薦的商品讓人“摸不着頭腦”,智能客服遇到不會的問題秒變“復讀機”。
人工智能到底給金融帶來了哪些改變?它是否真正產生了實實在在的經濟價值?是雷聲大、雨點小,還是真正解決了金融業務中的諸多痛點?每個人選擇不同,答案不同。
AI金融“四處碰壁”
|1000億美元投入“大海”,愣是沒砸出一個花來。
AI這條路,真的不好走。
即使是曾經一度成為世界首富的孫正義,最近也在人工智能的投資上栽了跟頭。
作為人工智能的頭號粉絲,為了投資人工智能,過去的幾年中,他籌集了1000億美元的基金,其中大部分資金投資了以人工智能為中心的70多家公司,但戰績潦倒,僅2019年,軟銀便虧損了880億元,相當於一年損失了兩艘“伊麗莎白女王”級航母。
其實,在現階段的大部分行業中,AI能顛覆的場景並不多。即使在數字化程度頗高的金融行業,AI也並非一帆風順。
比如「AI風控」,因為事關財產安全,一直是銀行等金融機構關注和投入的重點。
一直以來,銀行對「信用卡套現」等產業詐騙團伙十分頭疼。一些不法分子利用漏洞,通過有組織的活動,將信用卡的資金提現,用於投資、賭博。而「AI風控」可以通過對個體騙貸行為的分析,找到某種聯繫,識別出詐騙團伙,進而做出相應的封卡措施,減少損失。
但是,AI風控的效果的好壞十分依賴樣本,如果樣本的數量或者質量不達標,會嚴重影響風控的效果。
在欺詐等場景中,樣本天然比較充足,效果也相對較好。
但是在信用卡盜刷、賬户盜用等場景下,因為銀行的防控力度比較強,發生的案件數量較少(能積累到的樣本較少),使得AI風控的效果也是參差不齊。
邦盛科技副總裁王雷認為:“樣本的質量高低,很大程度上依賴於專家的經驗。”而目前,AI專家人才緊缺,有經驗的科學家更是鳳毛麟角,這也使得AI風控在行業整體效率上難以提升。
然而,相比智能投顧、智能營銷、智能客服等AI在其他場景下的應用,「AI風控」取得的成果已殊為不易。
在“AI+投顧”的場景中,智能投顧企業遲遲未能解決獲客成本高、大多數投資人未能實現盈利的問題。
虞愛是一家金融科技公司——悦保科技的CEO,他平時常常會接觸到做智能機器人的客户,也喜歡體驗新的產品和技術,在被問及AI在哪些場景中落地並不理想時,他首先就提到了智能投顧。
他認為NLP需要對語義有更精準的理解,現階段NLP只能實現部分流程的替代,若不能實現進一步突破,智能投顧公司與客户之間始終會存在一條看不見的“天塹”,很難進行有效且順暢的交流。
“此外,實現AI能力的基本要素在於數據的積累,而目前的情況是智能投顧公司積累的數據量普遍較少,這也阻礙了行業的進一步發展。”虞愛説道。
在非常火熱的“AI+營銷”的場景中,消費者多元化的需求和市場上產品的稀缺,形成了鮮明的對比,商品的推薦效果並不理想。
智能營銷通過優化AI算法,根據購買商品的網絡痕跡等非常有限的信息,為每一個客户構建用户畫像。構建好畫像後,把用户分層,然後和相應的標籤進行匹配。
“然而,智能營銷的模型做的效果再好,也很難通過少量的產品滿足消費者的全部需要。”專注於智能金融賽道的慧安金科CEO黃鈴説。
撬起AI金融的“支點”
AI金融不是一條坦途,人工智能在金融領域每一個業務的落地過程都充斥了“分歧”與“爭端”,想要更好地落地金融,需要共同的衡量標準和相對通用的技術指標。
而這些標準,不僅能為技術提供方和使用方達成共識“牽橋搭線”,也撕開了一道AI金融難以大規模落地的口子。
隨着與科技公司的合作愈發緊密,金融機構逐漸摸索出一套比較通用的技術指標,比如KS值、AUC、F-score,來鑑別哪家金融科技公司的AI實力更強。
KS值越大,表明正負樣本區分的程度越好,AI模型越好;「AUC」(Area Under Curve)可以分析在一條曲線下的面積到底有多大,如果曲線下的面積越大,這個模型效果越好,反之模型效果越差;「F-score」,用來判斷準確率。
此外,模型覆蓋率也是考驗AI產品是否有很好效果的指標之一。
假設模型可以覆蓋1000萬人,目標是需要觸及客户900萬人。如果在測試時,模型覆蓋了1000人,觸及到的目標客户達到901人,達到了模型的測試標準,但是,因為測試的樣本量太少、測試的次數太少,不代表AI產品就達到了標準。
AI模型也是有時效性的,隨着時間的變化,它的性能是否會大幅下降?AI模型在更新的過程中,是否需要大量時間和金錢?AI模型和銀行的核心繫統在對接的過程當中是否簡易?AI模型本身是否做的很標準化?
這些都是在技術指標之外,銀行使用AI產品時,必須要考量的標準。
冰鑑科技CEO顧凌雲説到:“部分金融機構,會執行一套客觀的指標來考察AI企業的產品質量。以24小時、7天或者30天為一個期限,他們會時時刻刻監控模型的效果,一旦模型的效果超出規定範圍,馬上就會根據期限調整產品。即使你本身的模型效果很穩定,他也會每3個月做一次測評,每6個月做一次測評,每一年對供應商進行一次重新的測評和調換。”
通過這種方法,金融機構可以保證他們使用的產品,一直由最佳技術實力的公司提供,而反過來,也不斷磨礪和推動科技公司在技術上的不斷創新與發展。
|給我一個支點,我能撬起整個地球。
作為第一個掌握槓桿原理的科學家,阿基米德認為只要找到事物的內在規律,即使撬動地球也是一件自然而然的事情。
但是,想要撬起「AI金融」這座大山卻殊為不易,需要找到許多支點,除了推進金融科技公司和金融機構“達成共識”外,怎樣驅動人工智能更加“智能化”和怎樣促進監管與科技之間的“協同發展”,也是我們需要思考的問題。
人工在前,智能在後
|人工與智能,孰好?
這是一個自AI創立以來,人們就津津樂道的話題,也是每一個AI企業家都需要思考和抉擇的問題。
慧安金科CEO黃鈴認為,人工和智能是互為補充的,具有完全不一樣的屬性。
人工,可以在自己已有經驗基礎上做非常複雜的推理,能夠根據一些蛛絲馬跡做複雜的關聯和分析,挖掘出潛伏非常深、偽裝特別像的風險 。
但是,人工也有幾方面的問題。
第一,要成為一個非常有經驗的專家,需要長時間的積累和沉澱。
第二,「人工」處理數據的“帶寬”非常有限,一天只能處理幾十個案件,發現很少的問題。
而對於機器智能來説,「人工」的劣勢,恰恰是它的優勢。它有足夠的帶寬處理海量的數據,還可以按照一些推理規則或者機器學習模型,幫助人們減少工作。
黃鈴説:“我們可以通過準確率、覆蓋率這兩個量化指標,對人工智能產出的效果進行全面評估。通過ROI來判斷這個人工智能項目是否取得了良好的效果。”
按照目前的發展來看,AI在人臉識別、文本識別以及風控、合規和監管等場景,效果都非常好。有些領域,AI的水平和能力甚至超過人類,比如風控合規監管,機器可以達到人類97%或者98%的水平。
但是相比人類,特別是非常資深的專家,AI的推理能力還是遠遠不夠。
“AI其實像一個被高考機器慣出來的孩子。”螞蟻集團首席AI科學家漆遠這樣形容AI目前發展“偏科”的情況,好比一位有着特別強大記憶體的學生,能通過題海戰術學習了大量知識點之後,做題效率極高,卻不懂怎麼推理。
比如在智能風控領域,存在大量的欺詐分子,他們隱蔽身份的手法千變萬化,機器也難以察覺。如何使用數據、對數據特徵分析以及如何把特徵組合起來,產生一個準確高效的信貸風控模型,十分具有挑戰性,需要有經驗的AI人才。
監管與科技
|科技可向善,也可為惡。
避惡揚善,是一個永恆的話題。
邦盛科技的王雷認為:“機器學習等技術,最大的一個問題是不透明、不可解釋。”而這一特徵給監管帶來了許多困擾。
人工智能應用往往通過採用神經網絡,使用算法產生結果,其複雜程度只有計算機可以理解,有時候連金融科技公司也不清楚人工智能是如何決策的。這種情形下,相關部門是否監管、如何監管科技公司成了一大難題。
隨着技術與產業的進一步融合,人工智能的決策可能涉及數百萬美元——甚至是關係到人類的健康和安全,在金融等受到高度監管的行業中,不能解釋人工智能的決策,對於企業和個體而言,都面臨着極大的風險,這也給監管部門提出了更高的要求。
人們往往認為監管與科技的關係是,先有人工智能等科技,後有監管,監管部門的技術與理念永遠落後於科技公司,實則不是。
品鈦副總裁李惠科説到:“政府監管部門跟業界之間的討論是非常頻繁的,一些高級別的監管官員會直接在羣裏,提各種各樣的問題和業內的公司管理者們一起進行思考。”科技企業在迅猛發展的時候,監管也在與時俱進,並參與和推動整個生態的發展。
如果非要形容科技公司與監管之間的關係,科技公司就是非常前沿、時尚的法拉利跑車,而「監管」是在整個道路上面設計紅綠燈、限速、停車等各種標誌的交通規則。
跑得再快的法拉利,受到交通規則的管制,到了路口,也要停下來;而紅綠燈的設置,保證了科技公司這輛飛車不至於“超速行駛”或者“跑得太慢”。雷鋒網雷鋒網雷鋒網