
大数据征信新格局:信央行还是信技术公司?
国内征信市场以央行为主导的单一格局即将被打破。目前的这套征信系统的覆盖范围主要限制在银行信贷信息,在用户覆盖面与数据多样性上,这套官方的征信系统有很大局限性。如何满足大批量没有征信记录者的金融需求,正是大数据征信所觊觎的市场机会。
传统信用评估模型是根据一个人的借贷历史和还款表现,通过逻辑回归的方式来判断这个人的信用情况。而大数据征信的数据源则十分广泛,包括电子商务、社交网络和搜索行为等都产生了大量的数据。
这些数据在信用评估中的效用究竟如何?大数据征信是言过其实,还是真的风控神器?群雄逐鹿征信市场,谁能成为最后的赢家?从金融服务到生活服务,中国的个人征信机构究竟有何“野心”?
带着以上问题,《第一财经日报》于近日专访了芝麻信用的总经理胡滔、腾讯征信总经理吴丹、FICO中国区总裁陈建、京东金融消费金融总监许凌、芝麻信用首席科学家俞吴杰、美国Zest Finance前模型组创始人顾凌云等。
个人征信市场刚起步 参与者已不少
个人征信牌照的发放久拖未决,但最近流出一份央行发放给各地营业部的《征信机构监管指引》(下称《指引》)。业内普遍认为,该文件的制定应该是个人征信牌照的下发铺路。
根据《指引》,监管部门对于涉足征信业务的机构提出了多项具体要求,包括个人征信机构设定保证金制度、股权变革的制度化管理等,以规范个人征信这个新兴行业的发展。
值得注意的是,该《指引》的适用机构不只是正在申请牌照的个人征信公司,还包括依法设立的经营企业征信业务的公司,以及金融信用信息基础数据库运行机构。
尽管个人征信市场在国内的市场化发展刚刚起步,但参与者已有不少。
除了首批八家申请征信牌照的机构外,以拍拍贷、积木盒子为代表的P2P平台,以京东金融、宜信为代表的互联网金融公司,以FICO为代表的第三方机构均开始利用既有的数据和技术布局大数据征信业务。
首批八家获得牌照 数据和技术公司纷纷布局
今年1月5日,央行下发《关于做好个人征信业务准备工作的通知》,个人征信业务正式“开闸”。腾讯征信、芝麻信用、深圳前海征信、鹏元征信、中诚信征信、中智诚征信、考拉征信、北京华道征信获准开展个人征信业务准备工作。
其中,背靠蚂蚁金服的芝麻信用和腾讯旗下的腾讯征信因其用户覆盖面广、数据规模庞大、技术实力雄厚而最具竞争力。另外,前海征信因背靠综合金融集团——中国平安也被视为有力的竞争者。
此外,考拉征信则汇集了拉卡拉平台上进行信用卡还款、转账、公共缴费等个人用户数据。华道征信的数据则主要来自其两家股东:新奥资本握有大量的居民燃气数据;银之杰旗下的亿美软通是中国三大电信运营商资深的战略合作伙伴。
而另外三家机构中,中诚信征信和鹏元征信的大股东均是老牌的企业征信公司,以企业信用评级业务起家。中智诚征信是民营第三方征信公司,以“反欺诈”业务为主。
其实,除了上述八家首批获准开展个人征信业务的机构外,不少拥有海量数据和技术基础的公司都在暗暗布局大数据征信市场。另据媒体报道,包括京东金融、百度金融、小米、宜信等30多家企业均有意申请第二批个人征信牌照。
以京东金融为例,除了盘活集团内的数据资源外,京东还于今年6月宣布投资美国的Zest Finance。这家由Google前副总裁创办的互联网金融公司主要利用机器学习算法和数据技术帮助用户做出更精准的金融风控及营销决策。
据了解,双方宣布成立一家名为JD-Zest Finance Gaia的合资公司,旨在利用Zest Finance在大数据挖掘和处理方面的技术构建京东自己的信用评估体系,目前Zest Finance的技术专家已经到位。
另一家大数据征信市场的有力竞争者——宜信旗下的至诚征信也在今年6月发布一款针对P2P机构、小额信贷机构和银行信贷部门的风控产品,包括信用评分、个人借款数据、个人风险名单数据三块内容。
此外,包括拍拍贷、积木盒子在内的P2P借贷机构也利用过去几年所积累的数据建立自己的信用评估体系。以拍拍贷为例,它于年初推出了基于大数据的风控模型——“魔镜系统”。
除了那些手握数据资源的公司外,围绕大数据征信领域的第三方技术和服务机构也开始涌现。例如,专注大数据挖掘的“百分点”、在在数据源上层完成数据分析和信用评估的“冰鉴科技”、“闪银”等。
征信市场究竟是大还是小?
但值得注意的是,与其它很多行业不同,征信市场的“容量”却十分有限。
对比美国,1960年代末美国的征信公司曾一度多达2200家,但随着行业不断发展和整合,如今已减少到400家左右。其中,艾可飞(Equifax)、益百利(Experian)和全联(Trans Union)三大巨头便占到了90%的市场份额。
芝麻信用曾在内部提到,当下大数据征信还处于第一阶段,即个人征信机构跑马圈地、百花齐放;而到了第二阶段,征信行业或出现大规模并购,最大的两三家公司将占据市场60%以上份额或者更多,其他几家共享细分市场。
这个预判基本已经成为行业共识。
顾凌云认为,中国的征信市场在三到五年之内不会一统天下,原因是因为到目前为止中国征信市场还处在第一步,也就是数据源整合这一步。但是在今后四五年之后应该会有两到三家成为最终的赢家。
许凌认为,大数据征信需要前期投入巨大的人力、物力,不仅周期长且回报慢。尤其是个人征信这部分,对于数据、资金、技术,以及场景都有很高的要求,最终只会有两三家主导市场。
眼下国内的个人征信市场刚刚放开,还处于群雄逐鹿的阶段。尽管首批仅有八家机构申请牌照,但在业内人士看来,相比牌照,数据和技术才是个人征信领域更为关键的门槛。
平安证券在一份报告中称,根据征信行业的产业链,个人征信公司经营成功的关键在于:数据来源的范围和准确性、数据处理能力、数据产品是否能够满足客户要求、是否具有多样性。
目前来看,除了获得牌照的机构之外,掌握信息搜索和网页浏览数据的百度、整合了电商、金融、生活服务数据的京东、积累了九年数据的互联网金融机构宜信、以及正在积极布局中国大数据征信市场的FICO都是有力的竞争者。
总体来看,目前国内的征信市场的发展潜力巨大,一方面是本身的市场需求具有成长空间,另一方面是征信服务能产生较好的外部效益,所以各家技术公司都很看好它,也愿意投入。但同时,大量机构涌入也使得这片市场尚未开放已成红海。未来征信市场前景一片光明,但是能活下来的机构却只可能是少数。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05