京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据征信六大难题待解
随着消费金融、网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现。但多元化、多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解。
一是数据的质量、共识性问题。相比于央行征信系统的共识性、数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛、品种更加丰富,但数据质量、共识性受到质疑。美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为《大数据,个人信用评分的大失望》的调查报告,报告称,大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。
二是同人不同信用问题。决定大数据模型预测准确性的两个关键因素是数据和算法,各家征信机构的基因不同,数据来源不同。目前八家机构中,鹏远、中诚信、中智诚是传统型的征信机构,数据来源主要是金融数据、公共数据为主,而芝麻、腾讯、前海、考拉、华道则除了接入传统数据外,主要大量用的是自身场景下积累的数据,这导致信用评估结果在不同公司间存在差异。
三是个人隐私保护及信息安全问题。根据《征信业管理条例》规定,采集和应用个人征信信息必须要获得征信主体授权,商业银行在向人民银行征信中心报送和查询使用个人征信信息时,必须严格执行此规定,对于报送数据范围、查询用途范围、授权形式、异议处理等都有明确的界定。而大数据征信依赖大量个人的互联网交易记录、社交网络数据,在多重交易和多方接入的情况下,隐私保护的权利边界被淡化,隐私泄露风险被迅速放大,公民维护自己合法权益面临取证难、诉讼难等问题。
四是公共信息的可获取、跨机构信息的可交换问题。如前分析,目前多家个人征信试点机构的信息来源带有浓厚的自身经营特点,申请个人征信试点机构大多首先拥有自己的具有垄断性的数据资源。而大数据征信要求的是信息的共享,而不是局部的垄断和壁垒。跨机构拥有的信息是否可交换,哪些需要获得信息主体的授权,如何保证交换过程和交换后信息不被滥用,在法律、监管、技术等方面都缺乏标准。同时,工商、税务、司法等公共政务信息的可持续获取,尚得不到保证。目前的主要做法是,各家征信机构或信息使用机构分散地获取这类信息,获取成本高,数据质量和数据的可持续维护得不到保证。
五是信息滥用带来的社会安全、公平交易问题。从首批试点的八家个人征信机构的运营情况看,市场开放之后,芝麻信用、腾讯征信、考拉征信等机构开始了一轮激烈的追逐赛,纷纷推出各自的评分产品,并争相在金融、购物、招聘、租车、租房、交友、酒店入住等领域尝试应用。但是,这些机构绘制出的人物“肖像”能否真实反映个人信用还令人质疑,获取信息所采用的关键技术的可靠性还有待进一步检验,没有制约的商业化应用很可能带来安全隐忧或消费歧视。
六是征信机构的独立性问题。从各国征信机构的发展历程看,狭义的征信主要是为放贷机构的风险管理提供信息支持的活动,遵循“信息采集者与信息产生没有任何关系”的独立第三方原则。而目前试点的几家征信机构多不是独立的第三方,一方面他们的数据来源于母公司,另一方面其兄弟公司又涉足放贷业务。评分结果对于其各自经营领域的客户分析、风险判断具有强相关性,但其他应用场景下评分结果的相关性则有待验证。
总之,围绕建立多元化的征信体系这一大目标,需要在健全信用管理法律法规,完善信用数据标准体系,加快各类公共信用信息基础平台建设,强化征信业监管等方面多方探索,既要大力推进,又要脚踏实地,不能指望一蹴而就。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17