我国的金融体系是信贷主导型,信贷市场规模全球第一。《巴塞尔协议III》的出台,对商业银行等传统金融机构的影响是巨大的。商业银行的业务定位有了全新的变化,不再是简单的金融服务和信用中介,风险控制在商业银行中扮演着更为重要的角色。为了更加直接地防范系统性风险的出现,提高政府在经济活动中的控制力,大数据技术诞生以前,以商业银行为代表的传统风控模式成为最符合国情的风控模式。
大数据风控初步探索 在传统风控模式中,大部分商业银行沿用的都是以程控交换为主的风险管理系统,虽然稳定性较强,但是客户容纳体量有限、交易通信指令复杂等不足让商业银行难以满足现代投融资需求,特别是全国7000万中小微企业的存贷款需求,早已突破了传统风控模式的压力测试、欺诈检测和风险监管的系统容量上限。需求促进创新,2008年开始,伴随着数据处理需求的增加和大数据技术的发展,商业银行等传统金融机构日渐意识到数据资产的重要性,并逐步将程控交换系统转换成IP网络为主的大数据风险控制系统。由此,大数据风控逐渐成为金融机构创新传统金融风控模式的变革利器。
另外,日均2EB级别的海量数据的产生,让蚂蚁金服为代表的互联网金融企业和中诚信为代表的征信机构开始在大数据风控领域崭露头角,围绕自身互联网平台和业务系统,打造了诸如“蚂蚁大脑”、“京东天机”的大数据风控系统。然而,2013年以来,随着互联网金融的快速发展,以P2P为代表的互联网金融企业如雨后春笋般涌现。具体而言,自2007年我国诞生第一家P2P平台起,P2P平台在快速发展的同时频频暴露出跑路、停业、提现困难和经侦介入等问题。大部分P2P平台均宣称,自家平台是采用先进的大数据风控技术,严进严出,基本能保障不良贷款率在P2P行业较低的水平。然而,P2P行业的风控现状却总是事与愿违。根据网贷之家发布的《2015年P2P网贷行业年报》显示,2015年全国正常运营的P2P平台总数2595家,累积停业及问题平台数量高达896家,占比34.53%。问题平台总数高达2014年的3.26倍。因此,P2P风控之殇从一个侧面反映出大数据风险控制存在有效性不足等问题。 大数据风控美中不足 众所周知,大数据风控是指利用大数据技术对交易过程中的海量数据进行量化分析,进而更好地进行风险识别和风险管理。大数据风控的核心原则是小额和分散,即预防资金相关者过度集中。小额的设计原则主要是针对海量数据构成的统计样本,尽量避免出现统计学中的“小样本偏差”。分散的设计原则主要是通过分析借款主体的人口属性、商业属性、行为属性和社交属性等数据来建立大数据风控模型。
基于大数据的风险控制,突破了传统风险控制模式的局限,在利用更充分的数据的同时降低了人为偏差,是金融机构创新传统金融风控模式的变革利器。应用大数据技术不仅可以提高风险控制的效率,还能节约风控过程中的管理成本。然而,大数据风控并不完美。
首先,大数据风控技术无法解决数据孤岛问题,即数据的开放和共享问题。目前,政府、银行、券商、互联网企业和第三方征信公司掌握的信息难以在短时间内互联互通,从而形成一个个信息孤岛。当交易在不同金融机构之间进行时,数据孤岛导致了信息的不对称、不透明,带来了大量的多头债务风险和欺诈风险。金融信贷行业若想利用大数据风控技术提升风控水平,就必须打破数据孤岛,解决信息不对称和信息获取不及时的问题。
其次,数据低质的问题也从一定程度上影响了大数据风控的质量。特别是来源于互联网的半结构化和非结构化数据,其真实性和利用价值很低。举例来说,在美国,Lending club和Facebook曾经合作获取并利用社交数据;在中国,宜信也曾大费周章地采集借款人的社交数据,以期实现对借款人信用的全面评定。但是两者得出的结论如出一辙,由于社交网络中的数据主观随意性很强,这些在网上提取的社交数据根本不具有利用价值或者利用价值十分低,错误率高达50%。电商平台上的交易数据也由于一些刷单现象而失真。这些信息的收集与利用就如同垃圾的运进运出,几乎没有任何意义。基于这些低质数据的风控效果也会大打折扣。
最后,大数据风控过程中存在数据泄漏问题。近年来,数据泄漏风险事件屡见报端。2015年2月12日,汇丰银行大量秘密银行账户文件被曝光,显示其瑞士分支帮助富有客户逃税,隐瞒数百万美元资产,提取难以追踪的现金,并向客户提供如何在本国避税的建议等。这些文件覆盖的时间为2005年至2007年,涉及约3万个账户,这些账户总计持有约1200亿美元资产,堪称史上大规模银行泄密。Verizon发布的全球调研报告《Data Breach Investigations Report 2015》显示,2015年网络安全事件共有79790起,确认的数据泄露事件超过2000个(2122个)。这些都大大降低了大数据风控的有效性和应用价值。
2008年11月,一位名叫中本聪的技术极客首次提出了区块链概念。区块链本质是一个去中心化的分布式数据库,这种去中心化、开放自治、匿名不可篡改的数据结构特性使其一出现就迅速取得大量关注。区块链的出现,也在一定程度上解决了大数据风控有效性不足的问题。
相关阅读: