京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据正给你的信用打分_数据分析师
编者按:信用是市场经济的“基石”。加快建设社会信用体系,有利于规范市场秩序、降低交易成本、增强经济社会活动的可预期性和效率。个人信用既与个人生活息息相关,也跟经济社会发展密不可分。
党的十八届三中全会强调建立健全社会征信体系,褒扬诚信,惩戒失信。目前,我国个人信用体系仍然不够完善,成为制约经济社会发展的“软肋”。推进我国的个人信用系统建设,企业、个人和政府分别能做些什么?本报从这三个方面入手,今起推出“关注个人征信”系列报道。
完善的信用体系,能让守信者畅行无阻,失信者寸步难行。除了中国人民银行的征信报告,信用评价有了新的渠道。1月28日,市场化运作的征信机构——芝麻信用开始在部分用户中进行公测,首推芝麻信用分,直观地呈现用户的信用水平。
日前,中国人民银行印发《关于做好个人征信业务准备工作的通知》,要求芝麻信用管理有限公司、腾讯征信有限公司等8家机构做好个人征信业务的准备工作。此前,央行已向26家企业发放了企业征信业务牌照,个人征信业务进入市场化运作阶段。
尽管从业时间长短不一、数据来源各异,但在个人征信业务的具体规划上,8家民营公司纷纷突出“大数据”和“互联网征信”。
打车、网购表现都可作征信参考
健全的社会征信体系,对于规范发展征信市场、服务实体经济具有重要意义。受限于征信系统信息来源,央行征信记录有大量未能覆盖的群体。数据显示,截至2013年底,在央行征信中心收录数据的8亿多自然人中,有征信记录的约3.2亿人,占总人口数的23.7%,远低于美国征信体系85%的覆盖率。个人有效征信数据主要产生于信贷领域,使用也主要在信贷领域。
引入民营的征信机构,尤其是有互联网背景的公司,个人征信可以在更多维度得以体现。
一个从未向银行借贷的大学生,可能没有央行征信中心的征信记录,但只要在互联网上留下行为轨迹,互联网公司即可通过海量数据挖掘和分析技术来预测其风险表现和信用价值,为其建立个人信用评分。比如使用手机软件预约打车,违约记录可以成为个人征信系统的数据来源;再如网上购物,即便不使用信用卡支付,购买过程中的表现,也可以被作为征信参考……信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等方方面面,如何利用这些数据完善征信体系成了市场化征信机构探索的前沿领域。
据介绍,芝麻信用采用国际上通行的信用分表现信用水平高低,最低350分,最高950分,分数越高代表信用程度越好,违约可能性越低。
“我们不仅记录用户良好的履约行为,也将记录用户不良的违约行为。”芝麻信用的相关业务负责人说,“让征信覆盖到尽量多的人群,是对已有征信系统的补充,具有一定普惠性质。”
信用即财富,大数据一分钟就可决定贷款额度
在欧美国家,一个人经常逃地铁票或是借钱不还,将引发找不到工作、租不到房、申请不到贷款等连锁反应。信用系统完善后,这样的情形也将发生在我们身边。
据透露,公测期间芝麻信用已经跟租车、租房、婚恋、签证等多个领域的合作伙伴谈定合作,并将很快试验性地对外提供服务。这意味着当你的芝麻分达到一定数值,租车、住酒店时可以不用再交押金,网购时可以先试后买,办理签证时不用再腾挪存款办证明,贷款时可以更快得到批复、拿到比别人低的利率。
蚂蚁金融服务集团运用云计算将数据进行整理、运算,采用一定的模型评定个人的信用。蚂蚁微贷就是建立在此基础上,甚至能做到一分钟之内决定给用户多少贷款。
腾讯财付通团队早在两年前就积极推进征信业务的探索。据介绍,他们的征信体系基于3个方面的考虑:首先是帮助金融机构提高风险管理水平;其次是希望推动普惠金融的发展,让普通用户更容易进行借贷;最后是希望引导年轻用户增强信用意识,建立“信用即财富”观念。
对于腾讯来说,开展个人征信业务的底气也很足:8亿的QQ账户,超过5亿的微信账户,超过3亿的支付用户,以及微博等多种服务聚集了庞大的用户群。“这些用户留存有大量的数据,成为我们展开征信业务的基础。通过这些数据的分析和计算,可以对用户形成一个全面的个人信用画像。”腾讯财付通相关负责人介绍。
个人信息和信用状况会变得人人皆知吗
前景虽然广阔,但摆在个人征信面前的难题也不少。在企业之间信息不互通的情况下,个人征信是否能够全面反映个人的信用情况?
深圳市中深融通投资担保有限公司总经理黄婷娣说,支付宝忠实用户的个人信息,在财付通上可能很难全面展现。个人征信想要更加权威,需要解决这个问题。“民营机构的个人征信评分能否与央行征信报告整合,也是个人征信评分是否好用的关键。”
个人征信到来,不少网友还担心,个人隐私会不会成为他人赚钱的工具?
我国《征信业管理条例》规定,禁止征信机构采集个人的宗教信仰、基因、指纹、血型、疾病和病史信息以及法律、行政法规规定禁止采集的其他个人信息。征信机构不得采集个人的收入、存款、有价证券、商业保险、不动产的信息和纳税数额信息。
腾讯相关负责人表示,在采集和查询个人信息时,必须获得信息主体的授权同意并明确使用的用途和范围。在开展征信业务时,将严格按照监管规定,进行数据的采集、处理和使用,遵守央行指导意见,同时愿意接受监管和大众监督。芝麻信用负责人也表示,所有信息的保存采用符合行业标准的最高要求,比如公安部信息安全等级保护3级等。
业内人士认为,个人征信体系建立过程需要不断完善,隐私保护是重中之重。相关部门应尽快根据实际情况,更新规定,加强监管,坚决打击非法收集和买卖数据的行为,让个人隐私得到更好保护。
境外的个人信用评定(链接)
在美国,FICO信用分是美国个人征信行业使用最为广泛的产品。艾可飞、益百利和环联三大征信局都采用了FICO信用分来量化个人信用质量和风险。FICO信用分主要参考付款历史、欠款数额、信用历史时长、新信用账户、使用的信用账户5个维度的信息。目前美国的个人征信体系已经覆盖了85%的人群。
在德国,有一家政府主导的征信机构,不过影响很小,目前最大的征信机构是一家民营公司,它储存着6600余万个人及400万家企业的6.5亿条信息,这意味着德国3/4的人口、几乎全部企业的信用状况都有据可查。
在法国,个人征信体系由国家主导建立。法国人把个人信用看成是社会地位的象征,有了不良的信用记录后,法国人会觉得自己的社会地位受到了影响,所以在法国的文化中,征信的道德约束感非常强。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21