京公网安备 11010802034615号
经营许可证编号:京B2-20210330
网贷P2P的大数据尝试_数据分析师
P2P行业要做真正的大数据有两个途径:一是建立自己的生态圈去了解客户特征,二是需要做数据挖掘寻找关键数据。前者是去粗取精地获取对风控决策有价值的信息;后者则是确定这些数据通过怎样的方式与一个人的信用情况和偿还能力形成关联。
纵观2014年的网贷圈,总离不开两个关键词:“风险”和“创新”。
在2013年网贷热潮中浑水摸鱼的网贷平台,在2014年纷纷原形毕露,跑路事件层出不穷,涉案金额也屡创新高。投资者深切体会到网贷的风险,对网贷开始审慎对待。
另一方面,网贷行业总体而言热度不减。民间借贷的热潮传导到线上,使得P2P网贷成为线下民间借贷热的另一片战场。借款人往往希望能够尽快地获得融资以解燃眉之急,在竞争激烈的行业背景下,谁能更快地提供贷款,谁就能占得先机。
寻找风控与效率平衡点
对借款项目和借款人背景的审查是贷款的重要环节,关乎风险的控制,这一环节目前一般依靠线上提交材料,加线下审核的方式进行。线上提交的材料往往不足以支撑起对于借款项目风险的判断,因此许多P2P平台或依托于当地的小贷公司,或自行组建线下团队,以完成风险考察的线下部分。平台通过实地走访能够更全面地掌握借款者的还款能力,从而控制一笔贷款的拖欠风险。
降低风险和提高贷款审批效率存在着先天的矛盾:想要达成较为完善的借款人资质考察,严谨切实地控制住风险,往往需要大量时间;而在征信体系并不完善的现状下,现有的渠道很难对借款人的资信情况做出全面准确的评估,更谈不上审核的便捷性了。这一部分的工作必需大量时间和资金的投入,对于平台的快速发展形成了一个不可忽视的阻碍因素。
网贷运营者在考虑平台扩张时,不得不认真思考怎样的方式才能给用户带来最好的体验:对于借款方,怎样提供申请便捷、成本低廉的借款通道;而对于另一端的投资方,怎样保证对于风控的切实掌握,为投资者的资金安全负责。对切实、高效的风险考察手段的需求呼之欲出。
网贷行业引入大数据思维
在这一背景下,如何控制P2P网贷的风险,就成为整个行业和投资者群体的关注焦点。而具有互联网基因的P2P网贷,运用互联网相关的创新手段来解决问题,无疑是顺理成章的一件事。诸多互联网金融企业都围绕这一方向给出了降低网贷风险的解决方案,而大数据是其中经常被提及的一个思路。
所谓用大数据来解决征信中的难题,是指系统、规范地整理与借款者相关的各项数据,并借助专业管理工具、分析工具从这些数据中提取出有价值的信息。在互联网时代,一个人的日常生活会在网上留下各种信息,经济活动也不例外。一个借款者的信用卡还款记录、电商网站的交易记录,甚至是社交平台上与经济活动相关的信息,都可以成为原始的分析数据,多角度地反映出借款者的信用状况和偿还能力。
通过互联网来采集这些“旁证”的成本,无疑要远远小于线下审核。由于数据采集的来源广泛且层次丰富,这些侧面的蛛丝马迹反而有可能更为全面地体现借款者的情况。
但是大数据的应用门槛不低,P2P行业要做真正的大数据有两个途径:一是建立自己的生态圈去了解客户特征,二是需要做数据挖掘寻找关键数据。前者着眼于通过一个稳态的信息来源尽可能地减少信息中的“噪音”,去粗取精地获取对风控决策有价值的信息;后者则是确定这些数据通过怎样的方式与一个人的信用情况和偿还能力形成关联,以及这一关联是否具有可靠性。
大数据在宜人贷里的应用
2014年10月7日,“极速模式”正式添加进“宜人贷借款”APP中。宜人贷表示,目前“极速模式”可做到1分钟授信,10分钟批贷,批贷额度最高可达10万元,平台月费率在0.78%。
宜人贷的公告显示,之所以“极速模式”可以实现,正是由于应用了大数据技术,通过积累的海量数据和算法模型,深入分析用户各方面的信息,以做出是否贷款及贷款额度的决策。这一切都由计算机在后台完成,大大节约了线下审核的时间。
笔者尝试了这一功能。借款人只需在“宜人贷借款”APP找到“极速借款”板块,点击进入后输入信用卡绑定的电子邮箱及邮箱密码,授权系统读取消费账单。系统根据信用卡使用情况自动为借款人评估授信额度。然后借款人会被要求授权系统读取电商及社交网站记录,进行资格验证。最后一步,输入银行卡信息完成借款申请,就可等待审核结果了。
宜人贷的尝试确实属于大数据的一个应用。电子邮箱里往往还保留着借款者所持信用卡的账单流水,通过技术手段不难从这些账单中刻画出该借款者的信用卡还款记录,真实有力地为信用、还款能力提供决策支持。而电商记录则可以在一定程度上反映出该借款者的经济实力、消费习惯和支出结构,同样是极其有价值的信息。 大数据应用需成熟和透明化
据宜人贷介绍,借款申请步骤中邮箱、电商及社交网站的信息填写,便是“极速模式”考量用户授信额度的关键。系统获取这些行为数据,交叉验证形成风控机制,进而计算出每一个用户的风险评分,最终判断是否应该放款,以及该用户的授信额度、还款周期。这些数据之间的来往和计算,几乎“秒达”,大大加快了贷款征信过程的速度。
使用过P2P平台筹集资金的借款人都会了解贷款申请手续的复杂。对于大额或本身存在一定风险的借款项目而言,详尽的审核必不可少;但对于具有良好信用资质、借款额度不高、借款周期较短的借款人,复杂的申请手续则显得十分不人性化,完全体现不出P2P快捷、便利的优势。如果能在控制风险的前提下简化步骤,将大大改善这部分借款者的用户体验。
在一项技术刚开始应用的时候,难免会产生一些问题。有投资者就对宜人贷这一放贷方式提出了疑虑。
宜人贷提出使用大数据的思维来解决这一问题,但目前为止没有披露具体的算法和基础数据的维度,这不禁让人对这样的方式是否靠谱心中存疑。个人征信是一个相对复杂和专业化的领域,凭借电商、社交网站和信用卡这些蛛丝马迹,或许能够提供一些信息,但也不能排除在某些情况下出现信息采集的偏颇。
其次,这样的方式就将许多没有互联网使用习惯的借款者拒之门外。曾有借款者反映,由于自己没有为信用卡设置收信的电子邮箱,导致宜人贷无法提取信用记录,造成贷款失败。但这一借款者有着良好的信用卡使用习惯,信用状况和资金状况一向优良。
再次,由于流程的简化,借款人往往在不清楚自己具体哪些信息被征用的情况下就完成了借款流程,过程中可能存在个人信息外泄的情况。比如,宜人贷要求提供信用卡账单邮箱的密码,这相当于将用户数据安全的大门向宜人贷完全敞开。这样的征信方式是否能像宜人贷宣传的那样安全需要进一步检验。
最后,大数据的采集范围虽然广泛,但毕竟是旁证,并不能直接有力地说明问题,旁敲侧击的征信方式给少数居心不良的借款者提供了逆向选择的温床。借款者有可能通过捏造虚假的网上记录来获得一个较好的信用评价,而与传统的风控手段不同,在信息不对称的情况下,大数据的方法在目前要切实识别出蓄意捏造的信息,仍有一定困难。
大数据引入网贷行业究竟前景如何?互联网金融风险评估机构“贷出去”认为:“急速模式”是科技进步为行业发展带来的红利,但是从技术成熟和行业现状的角度来看,这一形式目前还算不上大数据应用的完全形态,暂时只能作为P2P网贷形式的一个补充。宜人贷的尝试确实处于一个很有前景的方向,它极大方便资质良好的借款人快速筹集小额借款;但探索中投资人的利益必须得到保护,这一技术的更多细节也应该被大众知晓。这样,用大数据提速放贷流程的做法才能为用户的使用和平台的发展带来“飞一般的体验”,而不会成为一场积聚极大风险的“生死时速”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20