
用大数据来判定你的人品
电脑的作用可不仅仅是让你解决复杂的数学问题和播放萌猫视频,随着计算机技术的发展,它将能够判别出我们的为人,也许我们要为此感到庆幸。
一家名为 Upstart 的公司在过去的 15 个月中已经向那些几乎没有信用评级的人们借出了 1.35 亿美元。这些人大多是刚刚毕业的大学生,他们没有可抵押的资产、汽车,也没有相关的信用卡记录。
通常贷款机构会用上述指标来为一个人进行信用评级,以此判定他们是否能够获得贷款资格。然而这些年轻人刚刚踏入职场,还没有为自己建立起这一套用于判定信用等级的依据。因此 Upstart 转而参考了这些人的 SAT 得分、学校背景、所学专业以及在校平均成绩。这家公司需要参考的指标与公司对于录取新员工所做的背景调查差不多,除此之外他还会评估申请者的人格特质。
「如果两个人拥有同样的工作和同样的生活背景,比如都已经有孩子,相比之下那个在校时取得了更高 GPA 得分的人更有可能在五年之后还款。」Upstart 的联合创始人与产品主管 Paul Gu 解释道,「这无关于你的支付能力,它谨代表了你对于履行自己的义务是否看重。」
这种判定方法已经通过数据得以验证,那些会反复检查作业以及为了应对突击测试而额外花时间学习的人更有可能履行自己的债务。
Upstart 会通过数据分析和面对面交流来判定一个人的偿债能力。「我猜你可能会将这些特质称作性格特征,但是我们并没有使用这种标签。」年仅 24 岁的 Paul 向我们解释道。
拥有看重自己所承担义务的人格特质不仅能使人进入更好的学校,取得更好的成绩,同样也会让其看重自己的债务问题。ZestFinance 的创始人 Douglas Merrill 是谷歌公司前高管,他的公司也会通过一些非标准化的数据来判定是否要给一个借款人提供贷款。
Zest 公司的一个常用指标就是该人是否曾经放弃过一个预付费的手机号码。人的居住地变化不定,在找人的时候手机号码相比居住地址更加可靠。放弃了一个常用号码可能意味着你想要(或者不得不)逃避家人与潜在雇主的联系,这对于个人信用来说是一个糟糕的信号。
Zest 最近将业务拓展到那些「次优」借款人中,这些人可能是从最优借款人分类中跌落,也可能是从次级贷款借款人目录中得以提升。Zest 公司所面临的问题就是找出这些人为什么信用评级发生了变动,并且想要从中找出那些潜在的可靠的借款人。或许他们评级发生变化只是因为运气糟糕,比如承担了一次额外的医药费支出。
「『性格』这个词内涵丰富,一个人是否拥有还款能力和是否愿意还钱之间存在着本质的区别。」Merrill 进一步说明道,「如果仅仅是看金融机构提供的流水数据,你难以看出一个人是否具有还款意愿。」
Merrill 拥有心理学博士学位(他从普林斯顿大学毕业,从这点来看 Paul 应该是想要借钱给他的),他认为数据驱动的人格特质分析相比标准化的评判指标要更加公平。
「我们总是用各种方法来评判别人,但是如果没有数据支持,我们就是依靠自己的选择性偏见来做出判断。我们的判断通常来自于自身的认识,这通常就意味着人们总是会偏爱那些与自身相似的人。」利用熟悉感来进行风险管理非常原始的方法,这种方法得出的结果有失公平。
一个人的性格特征(我们通常会选择更为中性的词来表示相同的意思)如今已经可以由许多算法来完成判定。一家名为 Workday 的公司提供基于云端的性格分析软件,该公司发布了一款包含 45 项员工绩效指标的产品,其中包括了一个人在同一职位上工作了多长时间,以及他们的工作业绩如何。该软件中的指标可以用于预测一个员工离职的可能性,并且还能对于如何留住这类员工提供合适的参考建议,比如是给他换个新工作还是进行岗位调整。该产品还能够判断出主管经理是否具有留住人才能力,并且将其分为「人才大师」和「人才终结者」。
在 Workday 公司内部他们会使用该软件产品分析自己的销售队伍,并试图找出一个成功销售员的决定因素,结果发现造就成功销售员的首要品质就是坚韧不拔。
「在决定是否要雇佣某人或者晋升某人时,我们都会有着自己的偏见。」Workday 公司技术策略主管 Dan Beck 如此解释道,「如果你能够使用客观的数据去纠正这种存有偏见的判断,自然是极好的。」
Dan Beck 认为人们研究这些性格特征将会鼓励自身向这些好的品质看齐,因为「如果你知道一种指向成功的模式,那么为什么你自己不接受这种模式呢?」
从某种意义上来看,从数据中研究成功者的性格与行为特征与看名人传记寻找其成功的线索没有什么区别。只不过数据研究这种方式其范围要广得多,因为它的基础建立在观察每一个人的行为方式之上,而不像名人传记仅仅从个案研究入手。
我们有理由相信基于数据分析的性格特质判断会更加可靠。斯坦福大学计算机科学教授 Jure Leskovec 完成了一项对比研究,其内容是将数据分析的预测结果和与法官保释听证会的结果作比较。在保释听证会中法官们只有短短几分钟去评判一个囚犯是否应该获得保释,其结果是否会存在着危害社会的风险。据 Jure Leskovec 介绍,研究早期结果显示,依据数据分析的预测结果在预防犯罪上相比依靠法官个人经验判断获得了 30% 的提升。
「算法是客观的,偏见来源于人心。」Leskovec对其研究进行了总结。
然而这同时道出了很真实且重要的一点:任何算法都不是从天而降的。算法是由人写出来的,即使通过算法得出的结果并无偏见,但是在设计算法的过程中可能偏见已经存在其中,我们最终可能会接受一种有缺陷的信念即数学计算得出结果的永远符合事实。
Upstart 公司的创始人 Paul 表示他拥有完美的 SAT 得分,但是却从耶鲁辍学了,如果按照他自己最初设计的算法,连他本人也无法从 Upstart 公司获取贷款资格。据此他改变了对于算法的设计,因为他意识到了在今后工作中所承担的责任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18