京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用大数据进行P2P风险评级和风控只是理论可行吗
中国P2P平台交易规模的增速,比指数增长的陡峭曲线还狂放。据数据显示,中国P2P平台交易规模2011年为96.7亿元,2014年中国P2P平台的交易规模跃升为2012.6亿元,四年间几乎有了20倍以上的增幅。但随着市场规模的扩大、参与P2P业务的企业数量暴增,P2P网贷平台的乱象也由此而生,在2013年开始出现卷款跑路事件,2014年出现跑路等问题的P2P平台数量多达275家。
虽然从P2P平台诞生的那一刻起,几乎所有的P2P企业都在说风控,但事实上中国P2P平台的风控一直在红色警戒线边缘。陆金所传出2.5亿元坏账虽然最终被落实在Lfex业务上,而非之前猜测的P2P业务,但让普通投资者了解到这些P2P平台的风险水平已成了燃眉之急,利用大数据技术来做P2P网贷平台风险评级和风险控制,已经成了行业继续发展必须迈过的一道坎。P2P平台风险评级虽然不去控制风险,但可以客观上反应P2P网贷平台信用等级和风险控制能力,对投资者来说有重要的参加价值。
孤立封闭的数据难以形成大数据
5月11日,笔者受邀参加了“中国P2P网贷平台风险评价体系专家研讨会”,目的就是探讨用量化的评价体系来评价P2P网贷平台的风险。
据该项目执行者之一、中央财经大学互联网研究院助理研究员赵宣凯介绍,该P2P网贷平台风险评级体系有三个特征:第一,主要是从投资者角度出发,帮助用户识别P2P网贷平台的风险,为投资者选择哪个网贷平台提供一个科学的依据;第二,是以数据驱动为核心,通过理财魔方独有的监控引擎获得大量P2P平台数据,从这些数据出发,避免人为打分和设定权重所带来的主观臆断;第三,该评级从既有纯客观的统计方法,还包括主观判断为辅,综合这两个方法最终得出P2P网贷平台的风险排名。
随着专家学者和行业代表讨论的深入,专家们对利用大数据和评级模型的探索给与肯定,但也提出了现在整个大数据风险评级诸如数据采集困难、真实性和一致性难以保持一致的现实性问题,这不仅是几家评级机构能解决的问题,而是整个P2P行业需要克服的顽疾。
社科院金融所书记副所长何德旭教授在发言直接指出,社科院也在做P2P网贷平台的评价体系,主观评价体系和客观评价体系各有优缺点,但目前用大数据做P2P平台评价体系最大的问题就是数据。第一,到现在为止近两千家P2P平台的数据,估计都拿不到;第二,拿到的数据难以保证是不是真实的;第三,数据统计口径带来的数据不一致;第四,指标体系的选取和指标的赋值要有主观确定,这会造成最终结果的差异性。
利用大数据做P2P平台风险评价体系,理论上来说是非常理想的方法手段,但落实过程中需要对数据采集和清洗过程中会遇到很多挑战。尤其是互联网金融法律法规尚未健全的今天,P2P平台没有义务向第三方机构或者投资者提供关键的运营数据和重大项目信息披露,第三方机构只能通过网上舆情监控和公开交易信息来获得所谓的数据,但这些数据通常都按照“报喜不报忧”的原则被人为修饰和过滤了,自然也就难以P2P平台真实的运营情况和风险状况,基本上只有等到盖子捂不住了,才会爆出卷款跑路的新闻,但这时再去做风险评估,对投资者和贷款者都已经是为时已晚。但解决之道要做数据链的相互比对和筛选,理财魔方和易观在采集数据时会采用直接采集和向P2P企业直接咨询两种方式相结合的方式,尽管目前还无法约束P2P企业的吹牛和隐瞒行为,但未来如果数据更丰富、更全面,那么数据的可靠性和评级的准确性都有望得到进一步提升。
按照理想状态,大数据应该是不同企业、不同部门共享而成,它可以真实、动态地反映个人和企业的经济状况和信用等级,但目前各家企业对数据都是抱着封闭独享的态度,而且就我观察,大多数中小型P2P企业只有数据收集能力,而缺乏数据挖掘和利用能力。
在P2P风险控制层面,在之前采访P2P企业中谈及风控,大家都会不约而同地说用大数据来做风控,但再去细问,大多数都是语焉不详,这既有商业机密的考量,但我认为更重要的原因是大数据挖掘的能力不足大致的,大数据真正的技术含量和价值体现在提取和利用上,而不在于对数据的占有。目前国内的数据大多处于独立孤岛,很难形成由共享而成的数据链和数据网,而这恰恰是大数据风控所需要的。
大数据风险评级到底有没有真疗效?
利用大数据技术来做互联网金融机构的风险评级和风险控制,在理论上几乎无争议,但在实际行动中却困难重重,大数据识别风险的现实路径是否存在?还需要我们付出巨大的努力。
在研讨会上提问环节,我对利用来做大数据风险评级和风险控制的实现路径做了两种路径猜测,第一是国家主管部门利用法律法规来强制公开P2P平台基本的运营信息,以供金融投资者和贷款者来作为选择的依据,另一种是采用市场化的方案,谁拿出自己的数据来分享,就可以分享到量级对等的其他数据源,这有点像过去电驴和BT下载的P2P机制类似。
当向专家提出这两种实现路径哪一种近期更有可能实现,从专家们的回答中,我认为他们对这两种实现路径都很审慎。在与一位来自金融监管部门的专家私下交流时,他指出当107号文件明确了P2P归属银监会监管之后,其他有P2P业务相关的部门都在等待着银监会出台监管细则,以避免与之发生监管规则上的冲突,而对于银监会而言,现在P2P平台监管还没有非常健全和完善的国际通行标准和规范,所以其制定过程也会相对谨慎,周期也可能比希望的更长。
而P2P平台对于信息公开和数据分享的态度也是截然不同的,相对而言一些规模较大、运行相对规范的P2P平台更愿意分享他们的数据,这是彰显实力的好方法;而另外一些P2P平台运营涉嫌设立资金池等违规行为,就会对公开信息非常抵触,所以希望P2P企业自律、自觉提供真实数据,虽然短期看还很难实现,但未来有可能是一个趋势和方向,谁都希望把贷款放在一个公开透明的平台。
风险评级体系首先要从完善大数据机制开始
利用风险评价体系来评定P2P网贷平台的风险,从初衷上是值得肯定的。如中国人民银行金融研究所李博博士所言,评级体系可以借给投资者一双慧眼,同时也帮助监管者对市场进行梳理,评级机构有三个原则一定要恪守:第一是独立,第二是专业,第三是公正。模型和数据都可以通过迭代更新来不断优化,但P2P网贷评级体系的初衷一定要有所坚持,方能对P2P产业的发展起到应有的促进和警示作用。
现在不管是客观数据为主的评级体系,还是以专家意见为主的主管评级体系,归根结底都需要庞大的数据链来做做最基本的支撑,否则算法和模型再好,没有真实有效的数据也是在做无用功。
如果要拿一把尺子去做量具,最先要保证的就是这把尺子的刻度精准。针对P2P网贷平台的评价体系也是如此,其评级体系必须有辅以科学、完备的大数据采集、清晰、提炼和利用机制,这也是结论正确的前提和重要保证。
2015年的中国P2P网贷平台依然火爆,但风险也在逐渐累积,而利用大数据进行风险评级和风险控制的美好愿望尽管理论可行,但在现实还存在诸多挑战。但不管阻力和困难有多大,借助大数据做风险评级和风险控制又是势在必行之举,我们在征信问题落下的课必须要补上,这既是在还历史的欠债,也是在为中国互联网金融的铺设未来之路,既然绕不过去,那就直面现实勇敢应对吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28