京公网安备 11010802034615号
经营许可证编号:京B2-20210330
信用大数据 大数据信用体系 大数据信用体系建设
大数据开辟信用体系建设新路径
数据怎么体现出它的价值?最直接的体现叫数据变现。数据能不能跟金融对接起来,就是一个最直接的价值体现。
信用现在是一个高频词,如果不把这个基石重新建立起来,重新给它做踏实了,经济是没法往下走的。
西方信用体系的建立,约束的是结果,是约束“信”这个字。守信了,就得到了一个好的结果,失信了,就得到一个坏的结果。信用,另一个字是“用”,“用”是什么?我们认为它是个体创造财富的能力。如果我们把现在所谓的风险前置管理,或者是创造财富的能力量化,能把这件事情说清楚了,我们就能够走一条新的信用体系建设的道路。
量化,要从数据入手。不是所有的数据都有用,互联网上大量的数据都是垃圾,数据怎么体现出它的价值?最直接的体现叫数据变现。数据能不能跟金融对接起来,就是一个最直接的价值体现。另外,供应链里的数据含金量也非常高,它是一个企业核心的数据。
让大数据成为信用建设的“矿产资源”
全国人大代表、浪潮集团有限公司董事长孙丕恕在今年两会期间,提出了依靠大数据、建设征信体系的建议。他希望政府在制定宏观政策,建立征信法律法规的基础上,大力推进政府数据和机构数据等不同数据源的开放和共享,充分利用大数据技术,整合利用好各方数据。此前多年,他一直呼吁提升中国信息安全保护水平、完善中国信息安全保障体系等方面的建设。
在孙丕恕看来,大数据丰富了信用数据的数据源,不再局限于传统的金融领域数据,更基于交易数据、公共事业数据、商业信用、社会信用等多方面的数据来综合评判信用主体。数据的开放和整合是必经之路,大数据技术是有效支撑。
经济观察报:大数据在建设社会信用体系方面作用很大,但推进难度也不小,存在一些瓶颈。
孙丕恕:随着电子商务、移动互联等技术的发展,商业社会和人民群众的数据信息成为信用建设的重要“矿产资源”,尤其是大数据技术的应用,极大拓展了数据源的广度和深度,大幅提高了授信效率和信用评价的全面性、完善度等。因此,建设高效全面的社会信用体系需要充分发挥大数据的作用。
经过30多年的发展,中国已形成金融信用信息基础数据库及征信机构,依托央行也初步建立了个人征信数据库。同时,新兴的互联网公司依靠聚集的大量企业和个人的数据资源,也涉足金融和商业征信领域,成为征信市场的新兴力量。依靠大数据技术融合不同数据源、进而打造信用数据处理能力和信用产品并推广应用,成为创新社会信用体系的突破口。
大数据在信用体系建设方面的探索和实践
本干货出自2015年4月8日,金电联行(北京)信息技术有限公司执行副总裁艾小缤在清华-青岛大数据工程研究中心启动仪式暨大数据产业高峰会上所做的《大数据在信用体系建设方面的探索和实践》的演讲,这是该系列干货的第一篇。
演讲正文:
大家下午好。今天非常荣幸,其实这也是我近期第五次来青岛,之前来了几次,尤其是去年清华办了一个大数据峰会,当时也是我来讲。经过了这一段时间,我相信其实现在大家对大数据的认识越来越充分,越来越深入,包括今天上午,各位专家都讲了很多。我们现在可能对大数据感觉不陌生了,但是我们跟在座的各位有什么关系呢?我觉得在大数据这个时代,这个可能是我们所有人更关心的一个问题。
先说说信用。互联网+大数据,我们说互联网+的概念,但实际上我们说大数据本身也是一个很底层的,我们很有可能在后面会产生大数据,其实已经产生了很多大数据+金融、大数据+房地产、大数据医疗,它跟互联网有什么不一样的地方呢?我觉得互联网在前面,互联网实际上是影响了我们整个的生活,它的影响我们其实还能够接触到,还能够理解到,但是大数据的影响,我估计现在可能大家还没有真正接触到,甚至只是听说它对我们生活有哪些影响。今天我来讲一讲大数据在信用体系建设和在金融领域方面有哪些应用,这些跟我们有哪些关系。
大数据监管的信用力量
前段时间,国办印发了《关于运用大数据加强对市场主体服务和监管的若干意见》,全文出现大数据一词61次,出现信用一词94次,尤见信用和大数据之间的紧密关系。我们理解,实施信用的基础是信息,信息是来自数据的加工。
前段时间,国办印发了《关于运用大数据加强对市场主体服务和监管的若干意见》,全文出现大数据一词61次,出现信用一词94次,尤见信用和大数据之间的紧密关系。我们理解,实施信用的基础是信息,信息是来自数据的加工。
大数据是基础、是工具,信用是应用、是方式。让市场充分发挥资源配置的优势和作用,缺乏信用是万万不行的。
首先,大数据在哪里?无非是履职过程中掌握的数据,包括登记机关掌握的法人和其他组织的登记信息,自然人的登记信息。另外一块就是行政许可、审批、行政处罚、行政强制、行政征收、行政给付、行政裁决、行政确认、行政奖励、其他行政权力,包括一些财政专项资金分配、审核转报、行政调解、行政监督检查、行政复议等。均是客观反映行政相对人的记录。
征信大数据:我的信用,我来决定
你曾经试过信用卡逾期未还款吗?如果我告诉你逾期还款三次以上,会影响你日后贷款的利息,你可能就不会轻易忘记还款了。信用分数一直是个黑盒子,人们不知道自己为何会得到这样的评分,得不到适时反馈的结果是我行我素,甚至自暴自弃算了。
每一次我们悔不当初的时候,心里总会想:早知道就好了。其实,眼下大部分的现实反馈都是滞后的:等体检才知道“三高”,等完全失眠才知道喝太多咖啡有问题,而这时候再采取弥补和改正的措施可能已经晚了。未来,大数据可以帮我们“早知道”一点吗?进一步讲,未来大数据可以帮助我们迅速纠正错误的判断和行为吗?答案必然是肯定的,因为大数据的内涵来自量化与关联,但价值最容易体现的是准确的反馈基础上得到的预判。
现实中已经有很好的例子,比如健康手环,实时的收集生活活动包括走路、休息、睡眠、心率等数据,让我们更好地自律,更健康地生活。根据这些数据的反馈,我可以马上采取修正行动。
今天为大家介绍的一家创新金融公司是一个打破“信息黑盒子”的真实案例。这家公司叫Credit Karma,他们的业务完全基于信用数据, 继而发展到繁多的个人金融服务。该公司成立于2007年, 目前已经达到4,000万用户。占美国人口的12%, 非常可观。在美国credit score信用分数至关重要,大到房屋贷款,小到租房租车,对一个人的信用判断都强烈依赖于信用分数。
张韶峰:大数据重构中国信用体
下面我将重点阐述一下对大数据重构中国信用体系的一些思考。
各位都了解,自去年以来,国家密集出台开展社会信用体系建设的各种规划和实施意见。
由此预判,未来几年,应该是在国家主导下、在市场机构的参与下,共同探索和建立全民社会信用体系。
目前,中国的零售金融领域以及征信领域,落后于美国二三十年,但是互联网领域却只和美国相差两三年,甚至在某些细分领域还领先于美国。这样的差距以及中国巨大的市场机会,使得中国的金融发展不会走和美国相同的路径,而是会利用最先进的技术如移动互联网、云计算、大数据技术,跳跃式发展到一个新的模式阶段——互联网金融和大数据征信。
这个预测并非空穴来风,人民银行潘功胜行长在近期一次公开会议上特别提出,利用新技术条件发展新业态征信是需要积极面对的课题。央行对大数据公司进入征信系统持开放态度,并称预计不久将有大数据公司进入征信市场提供征信服务。
利用大数据来做征信,就是要把多种类型的数据绑定到一起,那这些数据怎么来,如何去组合,怎么计算,摆在我们面前的既是机会也是挑战。
我想给大家介绍的是,(一)传统的风险建模思路
20世纪50年代,一位工程师费尔(Bill Fair)和一位数学家艾塞科(Earl Isaac)发明了一个信用分的统计模型,80年代开始在美国流行,如今它是美国费爱哲(Fair Isaac)公司的专有产品——费爱哲评分(FICO)。美国三大征信机构都使用该信用分,每一份信用报告上都附有该信用分,以致费爱哲信用分成为信用分的代名词。
费爱哲信用分模型(以下简称传统模型)利用高达100万的大样本数据,首先确定刻画消费者的信用、品德,以及支付能力的指标,再把各个指标分成若干个档次以及各个档次的得分,然后计算每个指标的加权,最后得到消费者的总得分。传统模型的打分范围是300~850,三大征信机构各自输出自己的信用分数,分数越高,信用记录越好,三家的分数不能完全替代使用,但差别不大,相差在20分以内。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10