京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据能识别好人,但没法保证他不干坏事
最近一段时间,又有多家互联网金融企业获得融资,其中不少佼佼者的上市路径也愈加清晰。而根据移动互联网咨询机构艾媒于4月18日发布的一份调研报告,截至2014年底,中国互联网金融用户规模达4.12亿,预计2015年将增长到4.89亿。
“这个行业发展到深水区比拼的核心就是大数据和风控。”4月27日,随手科技有限公司CEO谷风在接受21世纪经济报道记者采访时表示,大数据在互联网金融的风控中发挥着关键性的作用,当然对其效果也应该辩证地看待,“大数据可以帮你找到一个好人,但没办法保证他不干坏事”。
随手科技刚刚宣布完成数千万美元的B+轮融资。
“好人”识别者
《21世纪》:背靠随手记和卡牛等产品积累的用户规模,随手科技目前已是不可小觑的互联网金融流量入口。我们注意到,从去年下半年开始,你们也进行了流量变现的尝试。目前这方面的进展如何?
谷风:随手科技的商业价值转化仅仅从两个季度之前开始,目前月成交在数十亿元人民币的规模,增长速度非常快。其中,基于记账工具随手记的理财市场自2014年9月推出,仅仅两个季度时间,月交易额增长了60倍;基于银行卡管理工具卡牛的放贷,也在今年开始接入,尽管目前的成交规模还不算大,但从放贷方反馈回来的信息来看,我们用户的含金量非常高。
如你所言,随手科技发挥流量入口价值的基础是,借助随手记和卡牛等积累起来的庞大用户规模。目前,我们的总体用户规模超过1.5亿,是后十位同类产品总和的近一倍。
我们的商业化才刚刚开始,我们也不着急,它让随手科技有了正向收入来源,更重要的是证明了我们实现商业价值的可能性。
《21世纪》:在发挥流量入口价值的过程中,随手科技与合作方是一种怎样的机制?
谷风:理财方面,目前我们主要是为货币基金提供流量,也在增加股票基金,未来也会考虑接入更多的产品,诸如私募、信托等。这方面的流程在互联网金融行业内已经比较成熟。
卡牛的贷款方面,目前我们接入的大部分是P2P,也有一些银行。从我们卡牛用户的角度来看,他们是获得贷款的一方,P2P的经营风险与他们无关。从P2P等放贷方来看,我们的用户有长期的数据,临时作假的几率比较低,他们放贷给我们用户的风险也很小。现在很多P2P的情况是钱不缺,而是缺好的投资标的,而我们的用户恰好有这方面的需求。随手科技在其中主要是赚数据和流量的钱,放贷方给我们一定比例的佣金。
在这个链条中,三方都有好处。
《21世纪》:你们的数据是怎样为放贷方所用?
谷风:放贷方可以在我这里定义指标,我们一般给出200-300个指标的值。他们给出指标,我们自己做大数据挖掘和分析,给他们最后的指标值。
《21世纪》:从目前的运营来看,怎么看这种基于大数据风控的有效性?
谷风:我们的用户不是今天早上想贷款才把数据给我,而是还没想到贷款就在我们的平台上积累数据,这种积累是一个长期的过程,作假的几率很低。这就是我们的大数据价值。它能帮助放贷方找到优质的借贷人,并且用比传统模式成本低得多的方式。我们知道,传统线下模式中,不仅要找人去扫街,有渠道费用,找到之后还要做尽职调查,进行风控管理。与之相比较,我们给出去的数据是经过清洗的精准客户,放贷方基本上做好贷后管理就行了。
当然,大数据风控的问题也要辩证地看。我的观点是:大数据可以帮你找到一个好人,但没办法让这个人不干坏事,因为有时候,有人拿到钱之后,行为模式也会跟着改变。这就要求放贷方要有一系列的手段和方法,去让借款人不去做坏事。
需要强调的是,在这个过程中,随手科技和我们的客户没什么风险,风险在P2P那边。
《21世纪》:随手科技是不是倾向于搭建一个平台?
谷风:从行业内来看,有些公司在融资后转向自营做P2P的迹象比较明显。随手科技的定位是工具和流量入口,自己不涉足P2P,而是选择做开放平台,让P2P等放贷方来接入。这一方面是出于不与合作伙伴竞争的考虑,另一方面也是基于大家分工合作。
我们认为,风控这件事还是让专业的人或公司来做比较好,他们赚风控的钱,我们赚数据和流量的钱,这样大家都挺开心的。而自己做风控,说不定什么时候一笔坏账就能让你吃不了兜着走。
P2P将现大浪淘沙
《21世纪》:你似乎比较介怀P2P行业的风险?
谷风:应该说,这是一个非常不错的行业。同时,我不认为P2P行业会倾向于集中化,未来只有三到五家,除非政策限制。就像房地产一样,万科再牛,还有很多规模相对不大的地产商也活得很好,金融行业太大了,哪怕一个小企业也有可能活得很好。
就P2P而言,这个生意赚钱的关键是风控,风控不好,经营两三年,坏账出来就比较头疼。可能第一年很开心,第二年很痛苦,第三年再不好就跑路了。
这个行业我估计至少要死个几千家吧,但最后活得很好的也可能有几百家,会有很多人成功。
正如《反脆弱》那本书中提到的那样,一种系统是脆弱的,比如瓷器、比如银行,它是硬邦邦的,如果承受力超过一定限度就会导致整个系统的崩溃,比如2008年的全球金融危机中的系统性崩溃。还有一种系统是反脆弱的,比如飞机,单架可能出事,但不影响其他的飞机,它是分散的,而且经验马上可以被其他飞机学会。
假如P2P这个行业的学习能力足够,一家倒了,其他家会马上来学习,看问题出在什么地方,从而找到生存空间。前面倒下几千家,学习了几千种死法,那么剩下的几百家可能就活下来了。
我认为做风控,单一数据源是不足够的,你数据的复合度越高,那么你风控的准确度就越高,进行风险定价的时候就越精确。
财务工具还是一片荒野
《21世纪》:这也是随手科技定位于开放平台的原因之一吧?
谷风:我个人认为,一种风控模型,适合某一个特定类型的人。但是我们的用户有很多的种类,一种风控模型总是搞不定,要找不同类型的P2P来合作。
当然,随手科技的定位是为整个互联网金融行业提供流量。因此,我们的主要任务还是做好工具,要开发各种各样的工具来满足人们记账需求。目前来看,随手记只适合一部分人,卡牛只适合一部分人,还有大量的人群我们还没有找到适合他们的财务工具。需求还远远没有得到满足。我们这次的融资主要也还是投入更多记账场景的产品研发。
尽管我认为中国财务工具市场的战斗已经没什么好打的了,上半场已经结束了,不会有太大的格局改变,但是,未来财务工具的使用场景将会越来越多,因为个人的资产类别也越来越多。
《21世纪》:你认为大概覆盖到了多大的场景?
谷风:也就10%左右。我们现在有1.5亿用户。也就是说,还有80%-90%的人需要的工具,我们还在考虑。我看到的是一片荒野,到处都是荒地,没人干,就像美国的西部大开发时的牛仔,遍地是机会,赶快跑,把地圈起来是正事。这也是目前我对变现还没有那么感兴趣的原因。
重要的是找到自己的山顶
《21世纪》:但变现还是蛮重要的。
谷风:当然,为了证明我们的商业模式,也会做一些尝试,比如贷款、理财。但那些都是水到渠成的事情,不是太难,也不是核心竞争力。
就像腾讯不会致力于成为一个游戏公司,尽管它靠游戏赚钱。它还是个社交公司,最终是靠社交网络建立这个公司的基础。
放到未来五到十年来看,我们就是个财务工具公司,只是我们赚钱是靠金融变现的手段,变现迟早都能实现,毕竟财务跟金融的关系太紧密了。
就好比爬山,你可以选择在半山腰安营扎寨,也可以选择爬到山顶上。如果你到山顶上滚石头,你会发现山腰上所有的建筑都会被你摧毁。所以重要的还是找到你自己的山顶。
从这个角度来看,我真正介怀的是中国人怎样用财务工具这件事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23