信保业务2.0：场景风控与量化风控

以融资性信用保证险为主体的信保行业自2017年的迅速发展得益于我国互联网消费贷和汽车金融市场的快速崛起（详见《我国信用保证险的现状——信保系列谈之二》，高声谈公众号进门右转），以融资信用为投保标的的信保机构通过为次级客户提供增信参与到信贷产业链条中，提高了信贷、保险的普惠性。

当前，信保业务的风控手段与信贷业务的高度一致，因此，对新形势下互联网信贷业务的风险理解与风控能力掌握，应是信保机构的基础能力。随着线上信贷技术日臻成熟，具备市场一流的线上量化风控能力是信保部门的必修课。这需要体制机制的保驾护航，必须建立一个与市场充分接轨的量化风控团队。

场景风控：信保机构的优先选择

在自有风控能力自信面对“全敞口风险”前，场景风控是实现风险闭环的好方法——即通过主业对借款群体的“影响力”或资金闭环等控制手段，达到对借款人正常履约足够的“威胁”作用；同时结合对可控、真实数据的量化分析，形成风险认识与控制的“组合拳”。如保险分期产品，可通过逾期退保方式实现资金闭环；再如修理厂贷款，可通过理赔款闭环偿付锁定本金安全。

笔者认为：场景闭环有两个层次。第一个层次是信息流闭环，即信保机构掌握借款人生产、生活用款过程中的信息流，可以准确了解借款人经营状况、项目进展、产品或服务购买或使用进度等情况。在此基础上通过运用合适的风险分析和控制手段，据此判断借款人的资信状况较为客观准确。

第二个层次是资金流闭环，即信保机构自身或者通过合作可以掌握借款人的回流资金，通过回款强管控适度降低对借款主体的资质水平和授信评估，极大提高了风险的可控性，是最为简单、直接的风控方式。就目前银行等资金方合作意愿看，双闭环的合作意愿最强，其中资金流闭环最为重要。基于资金流闭环的产品设计，如果市场规模足够大，同时有严格的操作流程，银行便具备较强的合作意愿。

单纯基于信息流闭环的信保产品，只有在相关领域有长期放贷经验，或是与风险偏好和创新性较强的银行合作方有可行性，与此同时银行的资金成本往往较高，符合高风险与高收益的匹配原理。随着普惠金融渗透率的不断提升，能够掌握资金闭环的信贷产品越来越少，倒逼着信保机构进一步夯实内功，在某一领域、某一产品中打磨好风控手段和产品打法，不断提炼形成核心竞争力。

对还款意愿的把控：一个容易忽视的问题

再高超的风控技术最多只能解决借款人的还款能力问题，但始终无法解决还款意愿问题。还款意愿取决人心，而人心并不是稳定不变的。现有的信贷技术只能通过分析借款人过去的信用执行记录来延续对其信用状况水平的看法，如果借款人因为突发事件变坏了呢？或者过往信用记录不好的人发自肺腑“改过自新”了呢？信贷或信保机构其实无从判别。

好的方法是，通过加大对客户逾期行为的“威胁”力度，加大违约成本和惩罚力度，迫使其保持较好的还款意愿。因此大家才会喜欢资金闭环，或是基于生态控制力设计的可增加对借款人“逾期威胁”的产品流程。笔者始终认为，蚂蚁的信贷产品表现优异，不仅仅是蚂蚁金服风控团队的功劳，更是与阿里打造的淘宝生态对借款人的控制及“逾期威胁”程度息息相关。

量化风控方法论详解

经过多年实践，大数据量化风控的效果得到了科学验证。IMF2020年课题《中国中小企业金融科技信贷风险评估》指出：“随机森林+大数据”的模型效果整体上优于传统评分卡，并且由于数据维度更广、模型迭代频次更高，其对规模以上信贷产品效果更优。

量化风控的工作思路是：通过对坏样本大数据参数字段的特征挖掘，提炼反欺诈或拒绝策略；通过分析不同因素（参数字段）与收入能力、负债规模、还款能力、还款意愿、违约概率等Y值的关联度与影响因子，结合风控偏好选择入模参数，进而形成判定分数支持具体决策。

经过多年工作经验总结，笔者认为做好量化风控必须注意以下几点：

01数据的全面、稳定输入

围绕个人行为的数据维度越多，挖掘出有用参数的可能性越大。其中，强金融属性数据的价值更高，央行征信、保险行为、支付行为、税收或公积金等是需要重点引入的数据源。其余还有如手机行为、网上行为、购物行为、位置与出行、学位学历等普适性较好的数据源以及ETC、车辆GPS轨迹、驾驶行为、种植地块面积扫描等个性化应用数据等等。

由于涉及个人隐私保护要注意从合法途径获取。我国数据产业处于高速发展阶段，要时刻保持与市场前沿的同步交流，及时引入有用数据。

02机器学习、随机森林、知识图谱是发展方向

随机森林已经被广泛的应用于贷前风险策略挖掘，相较于传统评分卡和专家经验模型，对特定客群定制化程度强，迭代效率更高。知识图谱是基于图的数据结构通过点和边来对客户进行画像，在特征挖掘和反欺诈领域应用广泛，其中聚类和关联算法对于团伙欺诈和黑产识别具有不可比拟的优势；知识图谱可以有效还原客户的关系网络，识别关联风险，进行风险预警和失联修复。

除此以外，还有XGBOOST、LigntGBM、Kmeans聚类、LSTM等算法工具均各有各自特点和适用场景，可以灵活运用并最终为模型效果服务。

03强化数据中台的功能定位

数据清理与结构化是提高建模效率的最主要环节，好的做法是：将应用到不同方向的数据集市建设纳入中台管理，数据基础清理、衍生变量生成甚至一些简单加工策略指标均直接由中台完成，或建立单独风控数据集市。这需要风控等数据需求部门提前明确数据加工要求，将稳定、固化的清洗或提取方法论告知中台部门予以实现。

04支持高效部署与迭代的决策引擎

决策引擎对模型或策略部署、效果监测和更新迭代效率影响明显：要具备串联、并联及多级管理的策略部署方式，同时支持不同权限的账户设置功能。更重要的是，要具备支持模型或策略的AB测试机制，支持样本的随机、同质划分并实时生成模型结果指标，甚至能够识别异常抖动参数，为建模人员观察、分析模型效果，优化模型策略提供高频的参考依据。

本文源自观察网