京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据征信六大难题待解
随着消费金融、网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现。但多元化、多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解。
一是数据的质量、共识性问题。相比于央行征信系统的共识性、数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛、品种更加丰富,但数据质量、共识性受到质疑。美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为《大数据,个人信用评分的大失望》的调查报告,报告称,大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。
二是同人不同信用问题。决定大数据模型预测准确性的两个关键因素是数据和算法,各家征信机构的基因不同,数据来源不同。目前八家机构中,鹏远、中诚信、中智诚是传统型的征信机构,数据来源主要是金融数据、公共数据为主,而芝麻、腾讯、前海、考拉、华道则除了接入传统数据外,主要大量用的是自身场景下积累的数据,这导致信用评估结果在不同公司间存在差异。
三是个人隐私保护及信息安全问题。根据《征信业管理条例》规定,采集和应用个人征信信息必须要获得征信主体授权,商业银行在向人民银行征信中心报送和查询使用个人征信信息时,必须严格执行此规定,对于报送数据范围、查询用途范围、授权形式、异议处理等都有明确的界定。而大数据征信依赖大量个人的互联网交易记录、社交网络数据,在多重交易和多方接入的情况下,隐私保护的权利边界被淡化,隐私泄露风险被迅速放大,公民维护自己合法权益面临取证难、诉讼难等问题。
四是公共信息的可获取、跨机构信息的可交换问题。如前分析,目前多家个人征信试点机构的信息来源带有浓厚的自身经营特点,申请个人征信试点机构大多首先拥有自己的具有垄断性的数据资源。而大数据征信要求的是信息的共享,而不是局部的垄断和壁垒。跨机构拥有的信息是否可交换,哪些需要获得信息主体的授权,如何保证交换过程和交换后信息不被滥用,在法律、监管、技术等方面都缺乏标准。同时,工商、税务、司法等公共政务信息的可持续获取,尚得不到保证。目前的主要做法是,各家征信机构或信息使用机构分散地获取这类信息,获取成本高,数据质量和数据的可持续维护得不到保证。
五是信息滥用带来的社会安全、公平交易问题。从首批试点的八家个人征信机构的运营情况看,市场开放之后,芝麻信用、腾讯征信、考拉征信等机构开始了一轮激烈的追逐赛,纷纷推出各自的评分产品,并争相在金融、购物、招聘、租车、租房、交友、酒店入住等领域尝试应用。但是,这些机构绘制出的人物“肖像”能否真实反映个人信用还令人质疑,获取信息所采用的关键技术的可靠性还有待进一步检验,没有制约的商业化应用很可能带来安全隐忧或消费歧视。
六是征信机构的独立性问题。从各国征信机构的发展历程看,狭义的征信主要是为放贷机构的风险管理提供信息支持的活动,遵循“信息采集者与信息产生没有任何关系”的独立第三方原则。而目前试点的几家征信机构多不是独立的第三方,一方面他们的数据来源于母公司,另一方面其兄弟公司又涉足放贷业务。评分结果对于其各自经营领域的客户分析、风险判断具有强相关性,但其他应用场景下评分结果的相关性则有待验证。
总之,围绕建立多元化的征信体系这一大目标,需要在健全信用管理法律法规,完善信用数据标准体系,加快各类公共信用信息基础平台建设,强化征信业监管等方面多方探索,既要大力推进,又要脚踏实地,不能指望一蹴而就。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19