京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘对客户进行深入分析
首先看一下数据挖掘在客户分析中的应用,数据挖掘主要应用于两大领域:客户智能和风险管理。客户智能分为数据层、挖掘层和营销层,数据挖掘属于中间这一层,是服务支撑层,为营销提供支持。数据挖掘传统的一些领域,包括客户细分、营销预测、产品关联、实时分析、客户提升、价值分析,以及现在随着大数据技术的兴起,我们会做实时分析,已经有些公司推出了基于文本的分析判断产品。
由于时间关系我主要介绍其中的几个,首先我们来看一下数据挖掘伴随着客户的生命周期是从始至终都存在的,拿信用卡业务来看,客户经历了从客户的捕获到客户的提升,到客户的成熟阶段,当然最后有可能发生客户的流失,完整的生命周期,不同的生命周期有不同的关注点。在下面,我们从数据挖掘的视角可以看到,其中有很多数据挖掘模型可以辅助业务的决策。其中黄色的是客户智能模型,黄色的是风险管理模型。
首先看客户细分,这是传统的客户细分,一般基于人口统计学的自然属性、银行交易信息、持有产品信息、互动反馈信息等等,针对这些进行细分,形成一个不是很深入的结果,可能会形成这样的用户分级。产生需要的,高价值低忠诚用户是蝴蝶,低价值高忠诚的用户是藤壶。最终细分出来的客户,可能是这个客户更深入洞察的角度,很巧跟邵钟飞也有相似的细分类型。所以,只有基于这些精准细分模型,才能给用户提供差异化的营销手段。
营销预测,举个简单例子,比如我有100个潜在客户,其中大概有25个人会对我的营销响应使用我的产品,并带来人均5元的收益。营销成本每人是1元,地毯式营销回报率是25%。在第二代的营销中我们可能会使用一些聚类的技术,营销的回报率可能能达到100%,这只是一个示例。第三代营销中我们可能会做双向预测模型,同时预测响应率和产品使用率,最终可能会收到比较好的效果,回报率要远远超出前两代。
来看流失分析,客户为什么会离开我们这家银行转移到其它银行?波士顿咨询公司做了一个市场调查,主要原因是服务质量不好,价格没有吸引力,产品没有吸引力,以及渠道的不方便因素,等等。同时有些市场调查认为,我获得一个新客户的成本是维持一个老客户成本的5倍,因此我们怎么样才能做好客户的流失分析,怎样才能留住客户?传统的客户流失分析是做事前的预测,以前不叫流失预测叫流失预警,这时你每个月都要想办法挽留这一大批用户,我们是不是要做一些事后分析?看看这些用户为什么会离开,提高自己的软技能和硬技能进行客户的挽留。
我们刚刚结束的一个项目案例,就是来做高端客户的流失分析。这个银行在2011-2012年这段时间的高端客户,流失率在18%左右的水平,同业的平均水平大概在12%左右,所以他认为他们的流失率偏高于同业其它银行。所以他想分析一下,第一,我流失的客户大概是什么样的构成情况,什么样的客户容易流失?第二,他们流失的原因是什么样的?第三,怎么预警挽留这些客户?这些客户中业务包括储蓄、理财、贷款,我们在做分析的时候,因为他不光要分析流失,他还要分析降级,他这里降级是指严重降级,AUM变动要超过两成。我们在里面分析的时候增加了一层,150万,这样让级与级之间的过度,大概一级就是损失150个AUM。
在做分析之前首先会有个思考,客户提供给我们这些基础数据涵盖了哪些内容,包括了人口统计学的属性,AUM的构成,借记卡的卡数、交易次数、交易金额等等这些信息,这和我做流失分析是有差距的,我缺乏一些流失相关的纬度,比如客户在我们银行主要是做什么业务的。客户在降级流失之前的一个月,最后保留的业务是什么。还有,客户降级流失的原因是因为他有消费需求吗?比如要付首付,还是因为更换银行?前两种我们认为:第一种,因为消费的需求,客户对你银行的忠诚度是没有降低的,他很有可能把这个银行作为接下来他首选的银行,提前还款这东西因为是个被动的业务比较特殊,如果只是单纯更换银行的话,这就说明客户对你的忠诚度有所降低。再有,无论是降级还是流失都是一个笼统的概念,客户的降级是短暂的,如果降了级又恢复,流失也有可能降到AUM的1%再恢复,还是有的客户销卡了?所以,要对客户有个全新的认识,当然这里面也认识到有些东西是数据之外的故事,比如这家银行某个月客户经理的流失率是比较高的,带来了客户流失率是比较高的。
首先我们增加了一个纬度,主要业务分类,这里面又分为月度主要业务分类,也就是计算每个月可以分为储蓄类、贷款类、理财类,还有混合类,后两类的客户比例是非常低的,月度的数据可以综合出客户在17个月中主要做的业务。有了客户主营业务的分类以后,我们可以继续来看客户流失的场景是什么,第一个场景就是刚才说的大额的消费、大额的刷卡。储蓄中断,客户的储蓄持续几个月有100万,突然就不见了,他是转移到了其它银行,至于转移到了其它银行做什么事情我们不清楚。理财的转移,在这个客户降级、流失之前,我们猜测这些人多数人去其它银行多数做理财产品。
同样,流失级别不能一概而论,我们会把客户流失严重程度分为从轻到重。所有的客户流失级别里面,大概有一半多的人是没有流失的,级别甚至是有所提高的,有17-18%的人是流失了的客户。再看做什么主业的客户容易流失?贷款里面蓝条是没有流失的,做贷款的客户是最稳定的,这并不是个很低的门槛。做储蓄的人是最容易流失的,因为储蓄转移的成本是最低的,网银现在转移储蓄肯定两块钱就转走了。
我们还可以看一看全部客户的主业分布图,高端客户里有43%的人是做贷款的,发生降级、流失的客户储蓄减少了、贷款增加了,验证了上面的信息。还有一些基础信息,地域中西部地区是最稳定的,36岁以下的客户愿意做的业务是贷款业务,非常稳定,55岁以上的客户储蓄理财的比例是比较大的,因此流失率也是比较高的。
有了以上的一些交叉分析以后,我们重点看了几个场景:一个是理财转移,理财转移在这段时间内给这家银行带来了大概104亿AUM的损失,大概有1/7的理财客户转移了以后有所恢复,也有1/7的客户转移了以后没有恢复。理财转移的客户偏好的产品和其它客户有没有区别?我们做个对比。可以看到转移的期限,左下角使转移和流失的客户更喜欢稳健型的产品。能不能预测一下贷款的余额占总额的百分比到底什么的时候,客户一次性提前还款的可能性较高,我们做了简单这样的统计度,平均的提前还款率是条红线,下面的横坐标是贷款的余额占的百分之比,贷款余额降到25%之后的时候提前还款率是非常高的。
最终,我们对这个银行给出了一些业务上的建议,比如对储蓄类客户推荐更多产品,尤其是提升交叉营销率,提高他的转移成本,其中交叉营销率都是重要的变量,对于理财客户要及时推荐给他符合偏好的产品,利用网银做好产品的衔接与客户挽留。对贷款的客户要做好提前布局,到当时他的贷款余额降到30%左右空间的时候要重点关注,预判到可能发生提前还款的时候,尤其是可以利用网银迅速的做出一些产品的推荐,比如给他推荐一款理财产品,早期的像房贷拿到7折利率的话,现在大概是4.6%左右的利率水平,现在很多银行理财产品都可以达到这一水平,甚至5%以上。有这样的网银推荐给客户的时候,他就要考虑我是不是要提前还款,他如果购买这个理财的话其实实现了双赢,银行留住了客户,这个人也拿到了更好的利率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14