京公网安备 11010802034615号
经营许可证编号:京B2-20210330
小白学数据分析:怎么做流失分析
最近看了很多关于流失分析的文章,也构建了一些模型,流失这个问题看似有些让人抓不住一根主线来做,这几天也有几个朋友问我"数据分析师"怎么来做流失的分析,但是最近工作变动,外加上很忙,就没有很好的跟他们说说这个问题。说到流失分析,很多人都知道使用决策树算法,C5.0、Chaid、Quest或者贝叶斯,也有用聚类分析的,总的来说流失分析的方法很多,但这些都是技术层面的,也算不上是一个流失模型。
前几天看到一篇文章来讲述怎么分析永恒之塔的流失,方法和过程真的很不错,不过流失分析远比这个还要多,其原因在于,那篇文章中,作者是选取了1-10级的新手作为研究对象,而实际上,流失分析面向的对象不仅仅就是新手(废话,谁都知道!),这句话是句废话,现在看,做数据分析的都明白,然而一旦真的做数据分析,研究流失率时,往往就忽略了我们要对那些人进行流失分析,眉毛胡子一把抓。
早先写过一篇关于流失分析设计的文章,但是后来反映设计的过于复杂和繁琐,没必要这么分析。其实,我觉得很有必要。流失分析不是你信手拈来就开始做你的流失分析的。在之前的文章中,主要设计的是历史用户的流失分析方式,把历史用户的流失分成了留存、沉默、流失、回流、植物等几类情况,实际上这种分类的形式是由玩家的游戏生命进程(生命周期)决定的,原因我觉得有以下几点:
正如文章所言,流失分析很多情况下只是告诉你谁会流失,流失的人有什么特征,而这两点对应的是流失分析的两个方面:
1. 谁会流失->流失用户的预测,告诉你流失的可能;
而流失分析最终的目的是通过这两点,仅仅结合业务分析流失的原因(再好的算法,模型不会告诉你原因),而解决了谁会流失,流失特征,流失的原因,那么就可以进行挽留措施的实施,到此一个完整的流失分析闭环才形成。
形成闭环的原因在于,新的一批用户会继续检验我们的流失分析模型,我们希望在同样的游戏进程时期或者状态下,能够通过不断的修正模型,使之具有普适性。这样的一些模型最后组合起来,就可以比较全面的描述玩家不同的游戏生命进程的流失特征。当然这需要不断的实验和分析,因为用户的质量也是要考虑的。最后,建立在反复使用模型分析的基础上,得到显著性的模型框架。
而这个过程中,值得我们注意的是,往往我们很多时候做的是这其中一小部分,而我们恰恰把这一小部分放大认为是流失分析的全部,比如我们做了40级-50级的流失用户,找出流失用户可能性,流失特征,但是往往忽略做一些挽留的措施,挽留的措施有的是软性的,比如通过活动,奖励等实施,也有通过更改系统设计来弥补,但是这要看你"数据分析师"做的流失分析用户流失的严重程度,换句话说如果这一阶段的流失是一部分客群引起的高流失,而这部分客群不代表我们整体客群(流失客群的特征与之前历史客群在该阶段流失特征不符合,那么这就不是系统设计的因素造成的),此时就不能轻易使用更改系统设计的办法,多数情况下采取软性的手段,帮助用户过度。
然而,回头来看,站在一个高度来看我们是根据了玩家的游戏进程到什么阶段(处于的状态)来确定我们的流失分析对象和方法的。
看了永恒之塔的流失分析我发现,之前的针对新手的流失分析没有深入的做过研究,PRARA模型关注的很多也是用户保有留存的问题,可以看得出一批新用户,我们关注更多的是留存问题,而那些历史用户我们"数据分析师"关注的流失问题。
针对用户流失的设计我们"数据分析师"大概有月流失,周流失,沉默,然而我们"数据分析师"在这块的分析远远没有达到一个高度,毕竟我们的收入主体还是来源于这些历史用户,本身来说付费转化,游戏学习成本都很低了,专注这些用户,做好挽留发挥的效益更大。
然而新用户正如文章也提及的情况,新用户对游戏的学习,操控,熟悉还不完全,即使我们获取了信息,流失特征,流失可能性,大概我们想找出来玩家为什么还是会离开难度就会比较大,即使我们有最好的新手体验流程和新手缓冲期,但不能避免的用户流失(当然这不是说新用户的留存、流失分析不重要)。然而反过来当玩家游戏生命周期进入稳定期或者提升期,却面临了很大的流失,那么我们获取流失特征,分析流失可能性,最后做出挽留得到的效益远远大于新手的流失分析。
说了上面这句话大概看到的人会笑,会喷我,补充一句的是,一个游戏就像一个池子,有进水口,也有出水口,我们"数据分析师"希望进水口大,出水口小,然而进水口再大,你不进水,有一天出水口也会让池子干涸,因此控制出水的同时,也要想办法做好进水口,也就是如何做好新玩家的分析,预测,挽留。因为留下的新玩家有一天也会变成我们定义的老用户,进而变成我们要设法挽留的老用户。每个玩家在游戏中都是有生命周期的,流失分析的目的是拉长这个周期的同时,将价值发挥到最大。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20在商业数据分析领域,“懂理论、会工具”只是入门门槛,真正的核心竞争力在于“实践落地能力”——很多分析师能写出规范的SQL、 ...
2025-11-20在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12