
如何使用RFM分析来了解目标客户
IBM SPSS Statistics 统计分析预测软件是一款在调查统计行业,市场研究,医学统计,政府和企业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件,在全球有大量的企业和个人用户。
虽然 IBM SPSS Statistics 中的统计分析功能强大,但需要依赖于丰富的统计分析背景知识进行操作,因此不便于一般的商业用户使用。为此在 18 版本后,IBM SPSS Statistics 新增加了客户直销模块,该模块的操作界面简单明了,结果报告分析清晰易懂,可以广泛的应用于电信,零售,银行,保险,证券,传媒,市场研究等行业领域,是为市场营销人员精心设计的用以提高直销效率,改善直销活动效果的工具。
打开 IBM SPSS Statistics, 在菜单中选择“直销”->“选择方法”,就进入“直销”模块选择方法界面,如图 1 所示。
图 1. 直销模块选择方法界面
在“直销”模块中,分为三部分:
了解我的联系人,用于对客户信息进行分析,将客户根据不同特征进行分类。改进我的市场营销活动,预测客户对营销活动的响应率。对我的数据评分,利用“选择最有可能购买的联系人”和其他模块中的多种程序构建预测模型,根据预测模型对新的客户数据评分。本文将介绍直销模块的第一部分“了解我的联系人”:
分析帮助标识我的最佳联系人(RFM 分析)通过本文,你可以了解如何使用客户直销分析模块中的 RFM 分析功能来了解目标客户,从而帮助你针对不同的客户制定 Smart 营销策略提供更可靠的依据。
如何使用 RFM 分析来了解目标客户
RFM 是在众多的客户关系管理 (CRM) 的分析模式中,被广泛提到的模型之一。该模型应用于衡量客户价值和客户创造利润能力的分析。RFM 模型通过一个客户的最近一次消费(Regency)、消费总体频率(Frequency)以及消费金额(Monetary)对客户进行 RFM 打分,根据客户的 RFM 得分来描述该客户的价值状况。
最近一次消费
最近上一次消费时间是评价客户价值的一个重要指标。理论上,最近购买产品或者服务的顾客,最有可能成为再次光顾的消费者,对推出的新品也最有可能做出反应。消费总体频率
消费总体频率是在限定时间内的购买次数。最常购买的顾客,也是满意度最高的顾客。消费金额
消费金额是在限定时间期间购买金额的总和。根据“帕雷托”法则——通常 80% 的利润来自 20% 的重要客户,消费金额越多的客户是越需要维系关系的客户。根据以上三个指标,对客户进行评级。在此假设三个指标的级别分别为从 1 到 5,5 为最高级别:
基于最近购买日期或自最近购买以来的时间间隔,消费日期越近或时间间隔越短,客户等级越高,为 5。反之,客户等级越低,为 1。针对客户消费频率,为客户分配一个频率等级,其中较高的值代表购买频率较高。例如,将最常购买的客户的购买频率等级评为 5。按消费金额对客户进行评级,其中消费金额值最高的客户将获得最高等级 5。将客户的三个指标等级合并就得到 RFM 得分。RFM 得分最高的客户即为对新产品最有可能做出反应的客户。例如,某客户最近一次消费、消费总体频率和消费金额的等级分别是 4、3、5,则该客户的 RFM 得分即为 435。应用背景及数据描述
某公司要对一种新产品进行推销。市场部门希望通过对客户进行 RFM 分析,了解客户的价值状况。根据客户的 RFM 得分,制定有针对性的营销策略,来维护客户关系,提高客户忠诚度。
销售部门中有以 Excel 表格式存储的客户信息,rfm_transactions 表中包括客户 ID,购买产品编号,购买日期和交易金额,如图 2 所示。
图 2. rfm_transactions.xls 概要信息
数据准备
IBM SPSS Statistics 读入 Excel 数据,具体步骤及设置请见参考资料“数据预测统计分析产品 IBM SPSS Statistics 实例应用讲解”中的 IBM SPSS Statistics 实例应用分析部分,在此不再累述。
客户直销模块 RFM 分析应用
通过 IBM SPSS Statistics 中简便快捷的“直销”菜单就可以对数据进行 RFM 分析。进入菜单:“直销”->“选择方法”,在“直销”模块中选择“帮助标识我的最佳联系人(RFM 分析)”按钮,如图 3 所示。
图 3. “帮助标识我的最佳联系人(RFM 分析)”按钮
点击“继续”按钮进入“RFM 分析:数据格式”对话框,如图 4 所示。
图 4. “RFM 分析:数据格式”对话框
RFM 数据格式
RFM 分析根据数据行表示的含义分为来自交易数据的 RFM 分析和来自客户数据的 RFM 分析。
来自交易数据的 RFM 分析
当数据行表示单笔交易记录,选择交易数据的 RFM 分析。交易数据举例如图 5 所示,数据列中包含客户 ID,购买的产品编号,购买该产品的日期和消费金额;数据行表示一个客户的一条购买记录,一个客户可有多条购买记录。
图 5. 交易数据
来自客户数据的 RFM 分析
当数据行表示单个客户的交易记录,选择客户数据的 RFM 分析。客户数据举例如图 6 所示,数据列中包含客户 ID,该客户消费的总金额、最近一次购买日期、购买总次数和最近一次购买时间间隔。
图 6. 客户数据
由于本例中数据是交易类型的数据,直接选择“交易数据”点击“继续”按钮进入“交易数据的 RFM 分析”对话框,如图 7 所示。
如果数据是客户类型的数据,请选择“客户数据”。具体设置在后面详述。
图 7. “交易数据的 RFM 分析”对话框“变量”页面
在“变量”页面中将变量“客户 ID”,“购买日期”和“交易金额”分别选入对应的“客户标识符”,“交易日期”和“交易金额”文本框。
在“摘要方法”下拉框中有四种汇总每个客户交易金额的方法:总计(交易金额总额),均值,中位数或最大值(最高交易金额)。在本数据中,交易金额是单次购买产品的单价,所以选择“总计”。
进入“离散化”页面,如图 8 所示。
图 8. “交易数据的 RFM 分析”对话框“离散化”页面
在 RFM 分析中,需要将最近一次消费、消费总体频率以及消费金额进行分级,在对数据的实际操作中就是将大量数值分类,称之为“离散化”。在“离散化”页面中可以设定将数值分类的方法。
在“离散化方法”框中可以定义数据是按照三个指标的优先级依次分类或三个指标独立分类。
在 RFM 分析结果输出中,类别对应着相应的块。在“块数”框中可以指定三个指标的块数。每个指标可选择 1 到 9 级进行分块,默认分为 5 块。
“结”是指具有相同指标值的客户。在“结”框中可以指定对具有相同指标值的客户如何分配到对应的块中。
选择“保存”页面,如图 9 所示。
图 9. “交易数据的 RFM 分析”对话框“保存”页面
在“保存”页面中,可以指定想要保存的变量,包括三个指标的原始变量,对原始变量分级后的变量(以“_ 得分”为后缀名命名的变量)以及 RFM 得分。还可以指定新生数据的保存位置。
选择“输出”页面,如图 10 所示。
图 10. “交易数据的 RFM 分析”对话框“输出”页面
已离散化数据中设置的输出图表是对图 9 中“已保存变量的名称”中的“崭新 _ 得分”、“频率 _ 得分”和“消费金额 _ 得分”进行描述。未离散化数据中设置的输出图是对图 9 中“已保存变量的名称”中的“最 _ 近 _ 日期”、“交易 _ 计数”和“金额”进行描述。可以根据需要选择输出的图表。在此选择所有输出图表。
全部设置完后,点击“确定”按钮,就可以得到客户的 RFM 得分,并可以在 IBM SPSS Statistics 的输出查看器中通过图表查看根据三个指标分块后的客户分布情况。在下面会对输出的结果做具体说明。
如果数据是客户数据类型,在“RFM 分析:数据格式”对话框,如图 11 所示,选取“客户数据”按钮。
图 11. “RFM 分析:数据格式”对话框
点击“继续”按钮进入“客户数据的 RFM 分析”对话框,如图 12 所示。
图 12. “客户数据的 RFM 分析”对话框
在“变量”页面中将变量“客户 ID”,“交易总金额” ,“购买产品总数”和“最近一次购买时间间隔”(或“最近一次购买日期”)分别选入对应的“客户标识符”,“金额”,“交易数”和“交易日期或间隔”文本框。
客户数据的 RFM 分析在“离散化”,“保存”和“输出”页面中的设置与交易数据的 RFM 分析基本一致,在此不再累述。
注意:对同一数据源进行交易数据的 RFM 分析和客户数据的 RFM 分析,输出结果一致。
结果报告分析
IBM SPSS Statistics 的输出查看器中对每张 RFM 分析输出的图表都附有结果说明,以便对输出含义的理解。下面就对各图表含义进行简单介绍。
如图 13 所示,RFM 块计数图显示根据离散化方法设定的块的分布。纵轴“时间先后顺序”显示按最近一次消费时间指标对客户分为 1~5 级,上面的横轴“频率”显示按购买频率指标对客户分为 1~5 级。客户根据最近一次消费级别和购买频率级别被分为 5*5=25 块。例如图 13 中红色标记的块,表示最近一次消费时间级别(或得分)为 5,购买频率级别(或得分)为 3 的客户群。在每块中,根据消费金额指标又对客户分为 1~5 级,图中显示为五条条图,从左到右表示消费金额级别(或得分)依次增高(即消费金额依次增大)。条状图的高低表示该条状图对应 RFM 得分的客户数量的大小。例如图 13 中红色标记的块,依次显示 RFM 得分从 531 到 535 的客户数量的分布。
图 13. RFM 块计数图
图中可见,相对别的块,分布在消费日期最近的(5 级),购买频率一般的(3 级)的客户数量较多,这些客户针对消费金额高低分布也比较平均。
从图中可见,该条状图中的客户的 RFM 得分为 555,表示这部分客户最近都有购物,频率和消费金额也高出其他客户,是最有价值的客户。
块计数表,如表 1 所示,和块计数图中的信息是相同,只是以表格形式表现每个分块中的个案数量。
表 1. RFM 块计数表
RFM 热图,如图 14 所示,纵轴“时间先后顺序”显示按最近一次消费时间指标对客户分为 1~5 级,上面的横轴“频率”显示按购买频率指标对客户分为 1~5 级。客户根据最近一次消费级别和购买频率级别被分为 5*5=25 块。对每块中的客户群的消费金额做均值运算,并在每块中通过颜色深浅显示消费金额均值大小。颜色越深的块表示该块对应的客户的消费金额均值越高。
图 14. RFM 热图
图中显示随着最近一次消费时间越近,消费频率的增高,颜色越深,说明消费金额均值也在增加,客户的满意度忠诚度也越来越高。
RFM 直方图,如图 15 所示,用于显示客户数量在最近一次消费时间、消费频率和消费金额的三个指标中的大概分布。
图 15. RFM 直方图
每个直方图的水平轴始终采用左侧为较小值、右侧为较大值的顺序。但对于“时间先后顺序”(即最近一次消费时间)图的解释依赖于最近一次消费时间的类型:日期或时间间隔。对于日期,左侧条代表较远日期,右侧条代表较近日期。对于时间间隔,左侧条代表时间间隔较小,即购买日期离现在较近。
RFM 散点图,如图 16 所示,用于显示原始数据中最近一次消费时间、消费频率和消费金额的三个变量之间的关系。
图 16. RFM 散点图
对于“时间先后顺序”(即最近一次消费时间)的解释依赖于最近一次消费时间的类型:日期或时间间隔。对于日期,越接近原点的点代表离现在越远的日期。对于时间间隔,越接近原点的点代表购买日期离现在越近的值。
RFM 分析生成一个新数据集如图 17,其中包含客户的最近购买日期,购买频率,消费金额以及各自的得分和综合之后的客户 RFM 得分。
图 17. 新生成的数据
RFM 分析输出的图表和 RFM 得分有助于公司市场部门了解客户的最近一次购买、消费频率、消费金额以及综合 RFM 得分的分布状况,针对不同价值的客户群,制定相应的营销策略。
小结
对客户进行 RFM 分析,并按 RFM 得分为客户价值排序,使得公司能够量化客户的价值。市场部门可以定期对客户进行 RFM 分析,通过客户 RFM 得分的变动,帮助公司制定更为可行的客户策略,提升客户交易量,增加客户忠诚度,维系关键客户。
总结及展望
功能强大,使用简单是 IBM SPSS Statistics 客户直销模块的特色,帮助市场营销人员利用客户数据深入了解客户,让市场人员在决策中更加自信。帮助企业制定智慧,有效的营销策略。从而从市场营销中得到更多收益。
目前 I BM SPSS Statistics 客户直销模块总共有七大模块,本文中主要介绍帮助了解的客户的模块:RFM 分析。希望读者通过学习此文,加以实践应用,能够从容自信的制定 Smart 市场营销策略。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15