京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据做P2P风评风控只是理论可行
中国P2P平台交易规模的增速,比指数增长的陡峭曲线还狂放。据易观智库数据显示,中国P2P平台交易规模2011年为96.7亿元, 2014年中国P2P平台的交易规模跃升为2012.6亿元,四年间几乎有了20倍以上的增幅。但随着市场规模的扩大、参与P2P业务的企业数量暴增,P2P网贷平台的乱象也由此而生,在2013年开始出现卷款跑路事件,2014年出现跑路等问题的P2P平台数量多达275家。
虽然从P2P平台诞生的那一刻起,几乎所有的P2P企业都在说风控,但事实上中国P2P平台的风控一直在红色警戒线边缘。陆金所传出2.5亿元坏账虽然最终被落实在Lfex业务上,而非之前猜测的P2P业务,但让普通投资者了解到这些P2P平台的风险水平已成了燃眉之急,利用大数据技术来做P2P网贷平台风险评级和风险控制,已经成了行业继续发展必须迈过的一道坎。P2P平台风险评级虽然不去控制风险,但可以客观上反应P2P网贷平台信用等级和风险控制能力,对投资者来说有重要的参加价值。
孤立封闭的数据难以形成大数据
5月11日,笔者受邀参加了“中国P2P网贷平台风险评价体系专家研讨会”,本次研讨会由理财魔方(北京口袋财富信息科技有限公司)、中央财经大学中国互联网经济研究院、易观智库共同主办,目的就是探讨用量化的评价体系来评价P2P网贷平台的风险。
据该项目执行者之一、中央财经大学互联网研究院助理研究员赵宣凯介绍,该P2P网贷平台风险评级体系有三个特征:第一,主要是从投资者角度出发,帮助用户识别P2P网贷平台的风险,为投资者选择哪个网贷平台提供一个科学的依据;第二,是以数据驱动为核心,通过理财魔方独有的监控引擎获得大量P2P平台数据,从这些数据出发,避免人为打分和设定权重所带来的主观臆断;第三,该评级从既有纯客观的统计方法,还包括主观判断为辅,综合这两个方法最终得出P2P网贷平台的风险排名。
随着专家学者和行业代表讨论的深入,专家们对利用大数据和评级模型的探索给与肯定,但也提出了现在整个大数据风险评级诸如数据采集困难、真实性和一致性难以保持一致的现实性问题,这不仅是几家评级机构能解决的问题,而是整个P2P行业需要克服的顽疾。
社科院金融所书记副所长何德旭教授在发言直接指出,社科院也在做P2P网贷平台的评价体系,主观评价体系和客观评价体系各有优缺点,但目前用大数据做P2P平台评价体系最大的问题就是数据。第一,到现在为止近两千家P2P平台的数据,估计都拿不到;第二,拿到的数据难以保证是不是真实的;第三,数据统计口径带来的数据不一致;第四,指标体系的选取和指标的赋值要有主观确定,这会造成最终结果的差异性。
利用大数据做P2P平台风险评价体系,理论上来说是非常理想的方法手段,但落实过程中需要对数据采集和清洗过程中会遇到很多挑战。尤其是互联网金融法律法规尚未健全的今天,P2P平台没有义务向第三方机构或者投资者提供关键的运营数据和重大项目信息披露,第三方机构只能通过网上舆情监控和公开交易信息来获得所谓的数据,但这些数据通常都按照“报喜不报忧”的原则被人为修饰和过滤了,自然也就难以P2P平台真实的运营情况和风险状况,基本上只有等到盖子捂不住了,才会爆出卷款跑路的新闻,但这时再去做风险评估,对投资者和贷款者都已经是为时已晚。但解决之道要做数据链的相互比对和筛选,理财魔方和易观在采集数据时会采用直接采集和向P2P企业直接咨询两种方式相结合的方式,尽管目前还无法约束P2P企业的吹牛和隐瞒行为,但未来如果数据更丰富、更全面,那么数据的可靠性和评级的准确性都有望得到进一步提升。
按照理想状态,大数据应该是不同企业、不同部门共享而成,它可以真实、动态地反映个人和企业的经济状况和信用等级,但目前各家企业对数据都是抱着封闭独享的态度,而且就我观察,大多数中小型P2P企业只有数据收集能力,而缺乏数据挖掘和利用能力。
在P2P风险控制层面,在之前采访P2P企业中谈及风控,大家都会不约而同地说用大数据来做风控,但再去细问,大多数都是语焉不详,这既有商业机密的考量,但我认为更重要的原因是大数据挖掘的能力不足大致的,大数据真正的技术含量和价值体现在提取和利用上,而不在于对数据的占有。目前国内的数据大多处于独立孤岛,很难形成由共享而成的数据链和数据网,而这恰恰是大数据风控所需要的。
此次P2P网贷平台风险评价体系的探索,有可能会去倒逼评级机构尽可能多地去获取大数据,甚至用O2O的方式去做数据验证和清洗,因为数据是这个客观数据评级体系的命脉,如果在信息披露和风控都相对规范的龙头企业带头,则有可能形成高透明度、高诚信企业自制的局面。
大数据风险评级到底有没有真疗效?
利用大数据技术来做互联网金融机构的风险评级和风险控制,在理论上几乎无争议,但在实际行动中却困难重重,大数据识别风险的现实路径是否存在?还需要我们付出巨大的努力。
在研讨会上提问环节,我对利用来做大数据风险评级和风险控制的实现路径做了两种路径猜测,第一是国家主管部门利用法律法规来强制公开P2P平台基本的运营信息,以供金融投资者和贷款者来作为选择的依据,另一种是采用市场化的方案,谁拿出自己的数据来分享,就可以分享到量级对等的其他数据源,这有点像过去电驴和BT下载的P2P机制类似。
当向专家提出这两种实现路径哪一种近期更有可能实现,从专家们的回答中,我认为他们对这两种实现路径都很审慎。在与一位来自金融监管部门的专家私下交流时,他指出当107号文件明确了P2P归属银监会监管之后,其他有P2P业务相关的部门都在等待着银监会出台监管细则,以避免与之发生监管规则上的冲突,而对于银监会而言,现在P2P平台监管还没有非常健全和完善的国际通行标准和规范,所以其制定过程也会相对谨慎,周期也可能比希望的更长。
而P2P平台对于信息公开和数据分享的态度也是截然不同的,相对而言一些规模较大、运行相对规范的P2P平台更愿意分享他们的数据,这是彰显实力的好方法;而另外一些P2P平台运营涉嫌设立资金池等违规行为,就会对公开信息非常抵触,所以希望P2P企业自律、自觉提供真实数据,虽然短期看还很难实现,但未来有可能是一个趋势和方向,谁都希望把贷款放在一个公开透明的平台。
风险评级体系首先要从完善大数据机制开始
利用风险评价体系来评定P2P网贷平台的风险,从初衷上是值得肯定的。如中国人民银行金融研究所李博博士所言,评级体系可以借给投资者一双慧眼,同时也帮助监管者对市场进行梳理,评级机构有三个原则一定要恪守:第一是独立,第二是专业,第三是公正。模型和数据都可以通过迭代更新来不断优化,但P2P网贷评级体系的初衷一定要有所坚持,方能对P2P产业的发展起到应有的促进和警示作用。
现在不管是客观数据为主的评级体系,还是以专家意见为主的主管评级体系,归根结底都需要庞大的数据链来做做最基本的支撑,否则算法和模型再好,没有真实有效的数据也是在做无用功。
如果要拿一把尺子去做量具,最先要保证的就是这把尺子的刻度精准。针对P2P网贷平台的评价体系也是如此,其评级体系必须有辅以科学、完备的大数据采集、清洗、提炼和利用机制,这也是结论正确的前提和重要保证。
2015年的中国P2P网贷平台依然火爆,但风险也在逐渐累积,而利用大数据进行风险评级和风险控制的美好愿望尽管理论可行,但在现实还存在诸多挑战。但不管阻力和困难有多大,借助大数据做风险评级和风险控制又是势在必行之举,我们在征信问题落下的课必须要补上,这既是在还历史的欠债,也是在为中国互联网金融的铺设未来之路,既然是绕不过去的坎,那就直面现实勇敢应对吧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04