清流妹:傳統的信用評估存在無法覆蓋全體人羣、信息維度比較單一、時間滯後等不足,大數據信用評估在注重深度的基礎上,拓展廣度,這二者之間究竟有何不同?
來源 | 簡書
作者 | 大聖2017
“大數據”概念的最早出現,是從2012年2月份紐約時報一篇文章開始的。到目前為止,在大數據領域當中的投資已經越來越熱,該領域企業越來越多。大數據在美國金融當中最直接的場景,主要運用於信用評估體系。
信用評分是一個數字,幫助貸款人評估一個人的信用報告,估計其信用風險。信用評分會影響一個人的能力,以符合不同類型的信貸和利率的變化。一個具有較高信用評分的人,可能有資格獲得更長的貸款期限和更低的利率,從而獲得更多的實惠。美國的信用評估體系很早,對每個人都有制衡作用。中國現在也在做,但是還不太成熟,這個領域中有很多機會。
本文通過一個典型案例,來介紹兩種信用評估模型,瞭解其中的差異。
案例分析
我們以歷史上的兩個典型人物司馬懿和諸葛亮作為代表,將他們歷史上的典故事例來模擬化舉例:假設兩人活在現代並且正在申請借貸,我們來分別評估其信用情況。
信用評估模型 1.0
假設我們搭建一個傳統信用評估模型v1版,在此模型中,我們會採集如下一些數據指標。
基於上述兩人的基礎數據指標而形成的信用報告,就可能分別有如下描述——
司馬懿:跟曹操混了那麼多年,日子過得不錯,擁有過許20年的信用歷史,而且這個官級從養馬開始一點點升上來,他可能蓋房子借過錢、買馬車借過錢,所以信用值也不錯,最近沒有新的貸款。
諸葛亮:日子過得沒那麼好,幫劉備打下蜀國了,但是畢竟蜀國財政沒那麼好。收入可能只有3000塊錢,過去24個月還違約過一次,只有7年的信用歷史,最近還老是借錢,借過3次,貸款類型也不豐富,借過錢買過馬車。
將這二者之間進行比較,毫無疑問,大家都會選擇把錢借給司馬懿,而不借給諸葛亮。這就是個典型的傳統風控模型,看重債務歷史,而不看重現在。
信用評估模型 2.0
倘若以互聯網思維來分析並建立起信用評估模型v2版,或許會獲得截然不同的結果。在v1版的基礎數據指標之外,我們還增加了許多額外的數據指標項,如下表:
所以在v2版中,司馬懿和諸葛亮的信用報告,則可能是這樣來描述——
司馬懿:其上網IP地址來自於魏國國家圖書館、蔡文姬茶樓等,他不從工作的地方來、也不從家裏來,可以證明他沒有穩定的收入。而他剛剛申請了兩個發薪日貸款,這證明他以前有錢,現在沒錢。而他的學生貸款是從公司里扣除的,説明他錢不歸他控制,而由魏國國家政府控制着意味着信用記錄並不好。而從地址來看,他最近一會在許昌,一會在洛陽,一會在長安頻繁搬家,從整體情況來分析,很可能最近他混得比較慘。
諸葛亮:其借錢的原因是他去年被馬車撞了,蜀國的醫療保障不健全,他只好自己付了醫療費,這意味着40%的DIT來自於他借款還醫療費,而之所以歷史信用記錄不長,是因為他剛剛搬到四川,當丞相的時間不長,信用體系仍然沒有建立完全,但最近五年他一直住在丞相府,地址相對穩定,而且在學生時代曾從司馬徽,龐德公那裏拿過獎學金。如果把所有的因素放在一起,信用評估的結果就會發生變化。
在這個大數據場景當中,如果有一個合適的建模的方式,能夠產生一個二維決策,那麼就可以看到,最終借款的人應該是借給諸葛亮,而不應該是借給司馬懿。
所以,真正的信用評估應該是這樣的:傳統的佔一部分,但是可替代的網絡數據也佔據一部分,包括用户在網上體現出來的網絡行為、社交信息和來自用户自己的回答,要把所有這些信息全部給綜合起來才可以。
在傳統數據當中,我們只看到了深度沒看到廣度;
在大數據場景下,更多地注重廣度,因此當下網絡上的數據也很重要。
傳統信用評估
美國的傳統信用評估體系很簡單,主要通過五大因素評估信用值。
傳統信用評估模型的參考要素
傳統信用評分模型的參考要素
首先是債務歷史(權重35%)。包括a)各種信用賬户的還款記錄;b)公開記錄及支票存款記錄主要包括破產記錄、喪失抵押品贖回權記錄、法律訴訟事件、留置權記錄及判決;c)逾期償還的具體情況,如果曾經發生違約,則會對個人今後借款能力產生重大的影響。
第二是未償債務(權重30%)。即當下總共欠了多少錢。對於貸款方來講,少量的債務,並不意味着這個客户的信用風險高。但是,如果一個客户有限的還款能力被用盡,則説明這個客户存在很高的信用風險。即使你是比爾蓋茨,如果你借款已經超過了你的償還能力,也是個大問題。
第三點信貸時長(權重15%)。如果有甲乙兩個人,甲在10年之前就有過一張信用卡,而乙直到今年才有第一張新的信用卡。對貸款人而已,雖然無法直接判斷誰的償還能力更強,但至少覺得甲有更多的信用數據,會更靠譜一點。
第四點新開立的信用賬户(權重10%)。在現今的經濟生活中,人們總是傾向於開立更多的信用賬户,選擇信用購物的消費方式。如每一次買房、買車都會產生新的信用卡賬户。據調查,在很短時間內開立多個信用賬户的客户具有更高的信用風險,尤其是那些信用歷史不長的人。
第五點是正在使用的信用類型(權重10%)。主要分析客户的信用卡賬户、零售賬户、分期付款賬户、金融公司賬户和抵押貸款賬户的混合使用情況。具體包括:持有的信用賬户類型和每種類型的信用賬户數。
這些東西全部加起來形成了美國現有的評分體系。
其中應用最廣泛的是由Fair Isaac公司推出的FICO信用評分模型。全球三大商業個人徵信巨無霸:益百利(Experian)、艾克發(Equifax)和環聯(Trans Union)都是以FICO評分為基礎來提供的,作為貸款人的重要參考指標。可以説,FICO評分技術為全球2/3的信用卡業務提供保護,僅在美國就幫助各類機構實現高達100億美元的審批貸款決策。
傳統信用評估的不足
傳統信用評估至少存在三個方面的不足:
FICO評分及相應人羣的分佈
首先,傳統的信用評估服務無法覆蓋全體人羣,特別是弱勢羣體。圖1展示了美國FICO評分與其對應的人口分佈情況,而根據FICO的標準,如果人們未能如期還款,或者缺乏借貸經歷,他們就會自動被視為風險人士,他們的貸款也就會被懲罰性地給以更高的利率。還有一種可能,那就是他們的貸款申請會被拒,無論是否事出有因。比如,遇到了醫療緊急事故,或者最近剛剛移民美國。即使在金融體系發達的美國,也約有15%的人羣,因為信貸記錄缺失或不完整,而無法獲得常規的金融服務,或者需要付出很大的代價才能獲得常規的金融服務。
其次,傳統信用評估模型信息維度比較單一。傳統的FICO評分模型的基本思想是比較借款人信用歷史資料與數據庫中的全體借款人的信用習慣,檢查借款人的發展趨勢跟經常違約、隨意透支,甚至申請破產等各種陷入財務困境的借款人的發展趨勢是否相似。它主要從前文所述的五個方面考察用户的信貸資質。但隨着信貸業務的進一步開展,FICO信用評分由於單一的標準、嚴苛的門檻和片面的評估結果而飽受詬病。
最後,傳統信用評估模型時間上比較滯後。雖然FICO評分仍然體現風險排序,但其預測絕對風險的能力和在2008年金融危機中的表現飽受指責。如圖3所示,FICO分數從2005年到2011年在美國人口中的分佈基本上沒有大的變化,這和2008年金融危機爆發之後出現大量壞賬的現實嚴重不符。
FICO評分從2005到2011年在美國人口中的分佈情況
大數據信用評估
由於傳統的基於FICO評分的信用評估模型覆蓋人羣窄、信息維度單一、時間上滯後,所以,在互聯網時代,需要探索信用評估的新思路——利用大數據技術來完善傳統信用評估體系。
美國互聯網企業ZestFinance公司則是其中的代表。其基本理念是認為 一切數據都是和信用有關,在能夠獲取的數據中儘可能地挖掘信用信息,從大數據採集和大數據分析兩個層面為缺乏信貸記錄的人挖掘出信用。
其基本理念包括:
一切數據皆為信用,“積少成多、匯流成海”。在此之前做統計、做因果系統的時候,總是希望能找到原因判斷這些事情到底是不是靠譜。但是在大數據的情況之下,可以暫時不考慮背後的原因,只看關聯不看因果。
數據的來源很重要。包括錯誤信息也是有用信息,比如説謊能體現出一個人素質。
大數據多階段建模。首先考慮過成千上萬種原始數據變量;然後理清變量關係,轉換為有用的格式;將被轉換變量合併到元變量中,形成用户畫像;將元變量輸入到不同模塊中,每種模塊代表一種“技能”;每一個模塊貢獻一定分數比例,合成最終的信用評分。
圖4:大數據徵信的數據源
這種基於大數據的信用評估體系和傳統信用評估體系相比,主要有以下幾方面的區別:
啓示
ZestFinance 主要面向兩類人羣:
1、一類是( FICO 評分接近或低於 500)無法獲得基本的信貸需求的人羣,解決他們的無信用評分借貸問題,
2、另一類是信用分數不高而借貸成本高的人羣,利用大數據徵信降低他們的信貸成本。
雖然ZestFinance的體量不大,目前僅為10萬美國人提供了服務,在美國的影響力有限,其新興信用評估體系還不夠成熟,真實的效果目前還很難總體評價。但是,為徵信業的變革注入了活力,特別是對於我國的徵信體系的建設會有強烈的示範作用。
需求方面——普惠金融需要挖掘更多人的信用。國內目前真正發揮作用的徵信體系主要是央行的徵信系統,所覆蓋的人羣還是非常有限,遠遠低於美國徵信體系對人口的85%的覆蓋。目前我國個人有徵信記錄的僅有約3.2億人,約佔13.5億人口中的23.7%。國內數量龐大沒有被傳統徵信體系覆蓋的人羣同樣也需要信用服務,享受金融普惠,這就需要探索徵信的新思路。
數據方面——海量的互聯網信息,成為徵信體系的新數據源。我國目前是世界上互聯網人口最大的國家,截至2013年12月,中國網民規模達6.18億人,互聯網普及率為45.8%,其中手機網民規模達5億人,繼續穩定增長。2013年中國網絡購物用户規模達3.02億人,網絡使用率達到48.9%。截至2013年12月,我國使用網上支付的用户規模達到2.6億人。這些海量而且豐富的互聯網數據資源可以被國內徵信體系建設很好地利用,通過分析互聯網上這些信用主體的基本信息、交易行為信息和金融或經濟關係信息,同樣可以挖掘出這些信用主體的信用模式。
技術方面——新興的大數據技術,使得“一切數據皆信用”成為可能。以大數據為代表的IT新技術的應用,給徵信體系建設帶來了新的思路,原來海量龐雜、看似無用的數據,經過清洗、匹配、整合和挖掘,可以轉換成信用數據,而且信用評估的效率和準確性也得到了一定程度的提升。新的信用風險體系的一個顛覆性的基本思想是一切數據皆信用,這是需要大數據技術來支撐的。
2014年2月25日,北京市衞生計生委和北京市疾病預防控制中心聯合主辦突發急性傳染病防控衞生應急技能競賽。圖/視覺中國
2013年的H7N9禽流感,2014年的埃博拉疫情,2015年的中東呼吸綜合徵……幾乎每年,重大傳染病的流行都讓人心頭一緊。作為國際化大都市,北京人流密集、國際交往頻繁,和國外新發傳染病往往只隔一個飛機艙門,一旦發生疫情,後果不堪設想。
然而,不管是禽流感、埃博拉還是黃熱病、裂谷熱,5年中都不曾在北京擴散開來。將重大傳染病扼殺在個例,得益於北京公共衞生系統構建的疾控“天羅地網”,這張大網涵蓋了疫情監測、檢測、後續處置的三大環節。
[監測]
發生疑似病例到報告不超24小時
今年以來,北京共發現人感染H7N9病例27例。想要預防和控制H7N9這樣的傳染病,對傳染源的甄別與撲滅是重點,早期監測與識別則是基石。
以H7N9為例,當患者因肺炎、發熱等症狀前往醫院就診時,醫生在診斷同時,會根據禽流感的相應判斷標準,詢問其是否有活禽接觸史等,如懷疑患者可能感染禽流感,會通過信息平台上報給疾控中心,並在中心的指示下開展隔離、消毒、病毒採樣檢測等一系列舉措。
為了確保醫務人員看病、篩查兩不誤,每年,疾控中心對各級醫療機構疾控科、感染科等相關科室人員進行定期培訓,到了某種傳染病高發期,培訓更會頻繁展開。在很多醫務人員的辦公桌上,都放有疾控中心下發的提示卡片,上面一條條列舉着高發傳染病的相應判斷標準。
監測系統的“觸角”不僅延伸到北京一級以上所有醫療機構,北京1000多所中小學幼兒園、300多家公園和旅遊景點,以及游泳場館、賓館飯店等場所均包含在內。只要出現疑似疫情,這些場所都會第一時間通過網絡、電話等方式上報給疾控中心。
目前,北京按照病種、症狀(早期只有症狀,沒有相應的疾病診斷)等劃分,建立了傳染病報告系統、症狀監測系統等78個傳染病和健康危害因素監測系統,這也是全國數量最多、覆蓋面最廣、反應最及時敏感的監測系統,覆蓋全時段、全人羣、全地區。這套系統始終高效運轉,從發生疑似病例到報告,不會超過24小時。
[檢測]
大醫院“入夥”共建傳染病檢測網絡
發現疑似病例只是疫情防控的第一步,實驗室的病毒檢測能力如何,則起到一錘定音的作用。
病毒實驗室、分子生物實驗室、組織培養室、樣本庫……走進北京市疾控中心傳染病地方病控制所,彷彿走進了大學裏的物理化學教學樓,十多間實驗室挨個兒排列在樓層的各個角落。
“對患者進行採樣後,我們會先提取其中的核酸,它含有生物的基因‘密碼’。因為核酸非常微觀,所以要將它放進PCR儀中,以2的n次方為增幅進行擴增,這樣哪怕核酸中只有1個病毒,我們都能找出來。”北京市疾控中心傳地所主任技師石偉先打開電腦上的一個案例,指着屏幕上的曲線告訴記者:“這是最後的分析結果,曲線的末端異常揚起,證明它是陽性。”
PCR、自動化工作站、二代基因測序儀……在擺滿“高大上”設備的實驗室中,3-4小時便能完成一份樣本檢測。不過,再高級的實驗室也無法承擔所有的流感樣本檢測工作。
傳地所主管醫師吳雙勝介紹,北京面積大、人口多,而疾控中心設備人手有限,為了縮減樣本運輸中的時間成本,防止疫情擴大,市疾控中心發動了協和醫院、北醫三院、朝陽醫院等38傢俱有檢測能力並通過相應考核的三甲醫院,將它們納入網絡實驗室。這些網點醫院採樣後可在院內自行檢測、上傳結果,之後再由疾控中心對樣本進行復核。
目前,北京建立了55家網絡實驗室和23家麻疹網絡實驗室、191家艾滋病檢測網絡實驗室,組成了北京市傳染病實驗室網絡,具備開展56項傳染性病原微生物檢測的能力。
鮮為人知的是,除了傳染病檢測,市疾控中心還擁有食品污染物、環境中有毒有害物質、毒理學檢測等檢測能力,其中,食品中激素等特定化學污染物檢測處於全國領先水平。
中心實驗室主任邵兵介紹,針對化學性食物中毒因子篩查這一世界性的難題,中心實驗室構建了我國流通常見毒物的“毒理學質譜庫”,與相關醫院合作開發了基於中毒症狀查詢的數據庫,實現了對化學性食物中毒的非靶標篩查,將傳統食物中毒單個樣品分析時間從幾天甚至數月縮短到數小時。這項技術在“北京懷柔山吧中毒事件”等不明原因中毒事件的調查中,起到了重要作用。
[疫情處置]
確認傳染源“就像刑警破案”
石偉先對今年4月時北京市一例人感染H7N9病例印象深刻。
今年4月5日,一位住在懷柔的男性患者被診斷出感染H7N9病毒,疾控人員隨後對其進行流行病學調查發現,該患者有活禽接觸史,清明節曾回延慶老家與弟弟團聚,買了七八十隻雞。據此對其弟進行診斷,發現其同樣感染了H7N9。隨後,延慶在周邊進行強化監測,一週左右又發現一例人感染H7N9病例。
吳雙勝介紹,前期監測、檢測、確診感染患者,都不是最繁重的工作,後續的疫情處置才是最為辛苦的。根據國家要求,病例發生區要開展為期10天的強化監測,區內2級以上所有醫療機構接診的所有流感和嚴重急性呼吸道感染病例,都要進行H7N9病毒檢測,少則幾百例,多則幾千例。今年,房山就在強化監測期內篩查出了感染病例。
與此同時,疾控人員還要進行大量流調(“流行病學調查”)確認傳染源,並防止疫情進一步擴大。以H7N9的後續疫情處置為例,如果感染者為本市居民,有活禽接觸史,工作人員需要調查其活禽來源、是否有互換交易,對其本家、購買活禽的市場攤位、密切接觸者都要進行採樣檢測。有時候,一個病例還會涉及多個區域、多種活禽來源。
“整個過程就像刑警破案,要找到元兇和幫兇,然後才能定性結案。”他説,簡單時半天就能“破案”,複雜時時間會延長至一週。
[回顧]
北京疾控這5年
2013年
北京市綜合7個監測系統,在48小時內成功發現、收治、控制與溯源一例人感染H7N9禽流感確診病例。
2014年
西非暴發埃博拉疫情,疾控中心制定並組織實施北京市埃博拉出血熱防控預案和各項防控措施,即時發現報告並迅速處置了43例留觀病例,對5633名疫區歸國人員進行追蹤和社區健康監測。同時按照國家衞計委安排,先後派遣6批7名公共衞生專家,援助埃博拉疫情防控。
2015年5月
韓國中東呼吸綜合徵病例輸入廣東。市疾控中心針對性地組織全市範圍的技術培訓,啓動55家網絡實驗室,並進行疫情模擬應急演練,開展中東呼吸綜合徵防控知識宣傳。
2016年
發現並有效處置全國首例黃熱病和裂谷熱病例;應對“山東疫苗事件”影響,實現脊灰疫苗免疫策略調整,實施一類疫苗保險補償機制,完成全國首次以第三方評估為方法的接種率調查,實現北京全市範圍冷鏈實時監控全覆蓋。
新京報記者 戴軒
(2017-10-17)
2017年3月23日,和合術被國家企業信用信息公示系統收錄。並在湖南成立衡陽市南嶽區和合術信息諮詢中心,接受廣大客户的諮詢以及為需要幫助的人服務。幫助更多感情破裂的人挽回感情。經營者為易洪永居士。
聯合國教科文組織保護非物質文化遺產政府間委員會(下稱“委員會”)第十一屆常會於2016年11月28日至12月2日在埃塞俄比亞首都亞的斯亞貝巴聯合國非洲經濟委員會會議中心召開。11月30日下午委員會經過評審,正式通過決議,將中國申報的“和合術”列入聯合國教科文組織人類非物質文化遺產代表作名錄(下稱“代表作名錄”)。易洪永居士為中國和合術傳承人,民間和合術第一人,實際運用中成功率最高的和合術大師。
易洪永居士,南嶽衡山第一奇人,民間和合術第一人,成功挽回感情案例最多,成功率最高的和合術大師,名人富商御用風水師,衡陽市南嶽區楊救貧堪輿研究中心創始人,衡陽市南嶽區和合術信息諮詢中心創始人。常常出國演講,傳播國學文化。
(2017-05-25)
企業即時信息公示制度有什麼要求?企業應當自下列信息形成之日起20個工作日內通過企業信用信息公示系統向社會公示:
1.有限責任公司股東或者股份有限公司發起人認繳和實繳的出資額、出資時間、出資方式等信息;
2.有限責任公司股東股權轉讓等股權變更信息;
3.行政許可取得、變更、延續信息;
4.知識產權出質登記信息;
5.受到行政處罰的信息;
6.其他依法應當公示的信息。
工商行政管理部門發現企業未依照規定於20個工作日內履行即時公示義務的,責令其限期履行,企業逾期不公示的,工商部門將企業列入經營異常名錄。
(2017-09-09)
為進一步做好食品藥品行政處罰案件信息公開工作,按照《食品藥品監管總局關於印發食品藥品行政處罰案件信息公開實施細則(試行)的通知》(食藥監稽〔2014〕166號)有關規定,現將2017年1-9月吐魯番市食品藥品行政處罰案件信息向社會公開。
2017年(1-9月)吐魯番市食品藥品行政處罰案件信息公示.doc
吐魯番市食品藥品監督管理局
2017年10月9日
(2017-10-10)