
网贷P2P的大数据尝试_数据分析师
P2P行业要做真正的大数据有两个途径:一是建立自己的生态圈去了解客户特征,二是需要做数据挖掘寻找关键数据。前者是去粗取精地获取对风控决策有价值的信息;后者则是确定这些数据通过怎样的方式与一个人的信用情况和偿还能力形成关联。
纵观2014年的网贷圈,总离不开两个关键词:“风险”和“创新”。
在2013年网贷热潮中浑水摸鱼的网贷平台,在2014年纷纷原形毕露,跑路事件层出不穷,涉案金额也屡创新高。投资者深切体会到网贷的风险,对网贷开始审慎对待。
另一方面,网贷行业总体而言热度不减。民间借贷的热潮传导到线上,使得P2P网贷成为线下民间借贷热的另一片战场。借款人往往希望能够尽快地获得融资以解燃眉之急,在竞争激烈的行业背景下,谁能更快地提供贷款,谁就能占得先机。
寻找风控与效率平衡点
对借款项目和借款人背景的审查是贷款的重要环节,关乎风险的控制,这一环节目前一般依靠线上提交材料,加线下审核的方式进行。线上提交的材料往往不足以支撑起对于借款项目风险的判断,因此许多P2P平台或依托于当地的小贷公司,或自行组建线下团队,以完成风险考察的线下部分。平台通过实地走访能够更全面地掌握借款者的还款能力,从而控制一笔贷款的拖欠风险。
降低风险和提高贷款审批效率存在着先天的矛盾:想要达成较为完善的借款人资质考察,严谨切实地控制住风险,往往需要大量时间;而在征信体系并不完善的现状下,现有的渠道很难对借款人的资信情况做出全面准确的评估,更谈不上审核的便捷性了。这一部分的工作必需大量时间和资金的投入,对于平台的快速发展形成了一个不可忽视的阻碍因素。
网贷运营者在考虑平台扩张时,不得不认真思考怎样的方式才能给用户带来最好的体验:对于借款方,怎样提供申请便捷、成本低廉的借款通道;而对于另一端的投资方,怎样保证对于风控的切实掌握,为投资者的资金安全负责。对切实、高效的风险考察手段的需求呼之欲出。
网贷行业引入大数据思维
在这一背景下,如何控制P2P网贷的风险,就成为整个行业和投资者群体的关注焦点。而具有互联网基因的P2P网贷,运用互联网相关的创新手段来解决问题,无疑是顺理成章的一件事。诸多互联网金融企业都围绕这一方向给出了降低网贷风险的解决方案,而大数据是其中经常被提及的一个思路。
所谓用大数据来解决征信中的难题,是指系统、规范地整理与借款者相关的各项数据,并借助专业管理工具、分析工具从这些数据中提取出有价值的信息。在互联网时代,一个人的日常生活会在网上留下各种信息,经济活动也不例外。一个借款者的信用卡还款记录、电商网站的交易记录,甚至是社交平台上与经济活动相关的信息,都可以成为原始的分析数据,多角度地反映出借款者的信用状况和偿还能力。
通过互联网来采集这些“旁证”的成本,无疑要远远小于线下审核。由于数据采集的来源广泛且层次丰富,这些侧面的蛛丝马迹反而有可能更为全面地体现借款者的情况。
但是大数据的应用门槛不低,P2P行业要做真正的大数据有两个途径:一是建立自己的生态圈去了解客户特征,二是需要做数据挖掘寻找关键数据。前者着眼于通过一个稳态的信息来源尽可能地减少信息中的“噪音”,去粗取精地获取对风控决策有价值的信息;后者则是确定这些数据通过怎样的方式与一个人的信用情况和偿还能力形成关联,以及这一关联是否具有可靠性。
大数据在宜人贷里的应用
2014年10月7日,“极速模式”正式添加进“宜人贷借款”APP中。宜人贷表示,目前“极速模式”可做到1分钟授信,10分钟批贷,批贷额度最高可达10万元,平台月费率在0.78%。
宜人贷的公告显示,之所以“极速模式”可以实现,正是由于应用了大数据技术,通过积累的海量数据和算法模型,深入分析用户各方面的信息,以做出是否贷款及贷款额度的决策。这一切都由计算机在后台完成,大大节约了线下审核的时间。
笔者尝试了这一功能。借款人只需在“宜人贷借款”APP找到“极速借款”板块,点击进入后输入信用卡绑定的电子邮箱及邮箱密码,授权系统读取消费账单。系统根据信用卡使用情况自动为借款人评估授信额度。然后借款人会被要求授权系统读取电商及社交网站记录,进行资格验证。最后一步,输入银行卡信息完成借款申请,就可等待审核结果了。
宜人贷的尝试确实属于大数据的一个应用。电子邮箱里往往还保留着借款者所持信用卡的账单流水,通过技术手段不难从这些账单中刻画出该借款者的信用卡还款记录,真实有力地为信用、还款能力提供决策支持。而电商记录则可以在一定程度上反映出该借款者的经济实力、消费习惯和支出结构,同样是极其有价值的信息。 大数据应用需成熟和透明化
据宜人贷介绍,借款申请步骤中邮箱、电商及社交网站的信息填写,便是“极速模式”考量用户授信额度的关键。系统获取这些行为数据,交叉验证形成风控机制,进而计算出每一个用户的风险评分,最终判断是否应该放款,以及该用户的授信额度、还款周期。这些数据之间的来往和计算,几乎“秒达”,大大加快了贷款征信过程的速度。
使用过P2P平台筹集资金的借款人都会了解贷款申请手续的复杂。对于大额或本身存在一定风险的借款项目而言,详尽的审核必不可少;但对于具有良好信用资质、借款额度不高、借款周期较短的借款人,复杂的申请手续则显得十分不人性化,完全体现不出P2P快捷、便利的优势。如果能在控制风险的前提下简化步骤,将大大改善这部分借款者的用户体验。
在一项技术刚开始应用的时候,难免会产生一些问题。有投资者就对宜人贷这一放贷方式提出了疑虑。
宜人贷提出使用大数据的思维来解决这一问题,但目前为止没有披露具体的算法和基础数据的维度,这不禁让人对这样的方式是否靠谱心中存疑。个人征信是一个相对复杂和专业化的领域,凭借电商、社交网站和信用卡这些蛛丝马迹,或许能够提供一些信息,但也不能排除在某些情况下出现信息采集的偏颇。
其次,这样的方式就将许多没有互联网使用习惯的借款者拒之门外。曾有借款者反映,由于自己没有为信用卡设置收信的电子邮箱,导致宜人贷无法提取信用记录,造成贷款失败。但这一借款者有着良好的信用卡使用习惯,信用状况和资金状况一向优良。
再次,由于流程的简化,借款人往往在不清楚自己具体哪些信息被征用的情况下就完成了借款流程,过程中可能存在个人信息外泄的情况。比如,宜人贷要求提供信用卡账单邮箱的密码,这相当于将用户数据安全的大门向宜人贷完全敞开。这样的征信方式是否能像宜人贷宣传的那样安全需要进一步检验。
最后,大数据的采集范围虽然广泛,但毕竟是旁证,并不能直接有力地说明问题,旁敲侧击的征信方式给少数居心不良的借款者提供了逆向选择的温床。借款者有可能通过捏造虚假的网上记录来获得一个较好的信用评价,而与传统的风控手段不同,在信息不对称的情况下,大数据的方法在目前要切实识别出蓄意捏造的信息,仍有一定困难。
大数据引入网贷行业究竟前景如何?互联网金融风险评估机构“贷出去”认为:“急速模式”是科技进步为行业发展带来的红利,但是从技术成熟和行业现状的角度来看,这一形式目前还算不上大数据应用的完全形态,暂时只能作为P2P网贷形式的一个补充。宜人贷的尝试确实处于一个很有前景的方向,它极大方便资质良好的借款人快速筹集小额借款;但探索中投资人的利益必须得到保护,这一技术的更多细节也应该被大众知晓。这样,用大数据提速放贷流程的做法才能为用户的使用和平台的发展带来“飞一般的体验”,而不会成为一场积聚极大风险的“生死时速”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02