京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用数据管理“用户生命周期”
腾讯的精细化运营是如何贯穿于整个产品过程中的?
腾讯用到一个很重要的方法,即用户生命周期管理办法。这也是社交网络事业群正在力推的一个很重要的方法论。
什么叫用户生命周期管理?传统营销学讲的是客户生命周期管理,因为腾讯社交群主要客户就是用户,所以我们叫用户生命周期管理。但是传统的对应的理论是客户生命周期管理,简称CLM。《王永庆传》提到一个一个米店老板怎么做生意,他每天会收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米,然后推算出这个家庭什么时候能把米吃完。比如买10公斤大米,估计是半个月,到快吃完时,他就会主动送货上门,或者主动打电话。他用这种办法赢得了客户。很快他的经营网络就超过了其他店。
再比如一个游戏数据图表,横轴是游戏用户使用时长,纵轴是活跃用户量。第20轴到25轴用户分两波,有60%的用户活跃用户量下滑得比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品时是有一个新鲜感期,过了这一段时间以后,他感觉就会下降,甚至会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态。再看很多网页应用或者一些手机APP,它的拐点会更早出现,使用这个业务一到两个月就可能会处于高流失风险的状态。我们通过数据怎么快速定位?如何预计这些用户的流失以及帮到产品经理理解它为什么会流失?建议他在产品运营时要策划什么样的活动?
这是一个完整的生命周期管理图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等。我今天主要聚焦在两个阶段,也是腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是通过数据能够帮产品经理带来收入,或者带来活跃用户量。
上述游戏案例其实是一个真实的应用。这个应用在横轴是加入应用的时间,纵轴是人均操作次数,即用户活跃度。从这个线能看到,这些用户在购买这个业务前肯定有很多免费的操作才能刺激他购买这个应用。他打算购买前,活跃度突然变得比较高,他购买后,活跃度开始迅猛地增加。
有很多产品的价值传递不一定非常到位,所以我们往往看到很多产品在第一个月和第二个月的流失率非常高。因为作为一个新用户,如果你的新手教程做得不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,可能就会流失,而且这个比例非常高。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这期间会流失得很快,然后我们把它定位出来。定位出来以后,我们要知道它是由于什么样原因想离开这个应用,或者想离开这个游戏,做快速预警。
【如何利用大数据分析进行精准定位】
另外一个阶段是拉新阶段,比如有的产品经理想快速发展新用户,我们用什么样的数据支撑让它更精准定位到用户?
目前,我们将新应用的用户高流失预防暂分两个阶段。
我们有很多历史数据可以学习,即什么特征用户有可能成为新用户。这个数据以及它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法——主要用“决策树”的办法研究什么特征的用户能够成为新用户。比如买房用户,如果小孩有四五岁时他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求?这里有很多特征和他购买的驱动力非常相关。
我们通过500多个字段预测用户下一阶段的转化率。“决策树”是得到一个知识树的结构,我们找了比较重要转化率较高的几个树枝去做运营,比如将潜在用户划分成七类用户,每类用户的转化率、它转化概率跟普通用户的转化率的倍数都知道。知道这个特征以后,就可以定位这个用户,然后把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,转化概率又比较高,而且我们知道他喜欢什么?
因为“决策树”能识别出他的特征出来。这可以建议你对这些用户,比如他喜欢玩虚拟空间装扮,你的业务又刚好对应这个,你就可以策划一些活动,拉动他冲动性消费,他就更容易购买这个业务。
刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个。有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。
这个是什么概念呢?比如我要买车,我可能在买车前一个月突然会对汽车类的网站,或者汽车类论坛的浏览量可能比前几个月流量要多得多,这很正常。流量的突增其实意味着我有更明显的购买意向。因此,我们在设计变量时,除了常规型、状态型统计变量和简单的统计量,还要考虑设计一些增长型变量。增长型变量其实在预测用户在转化过程中更有效。
这是我们在拉新阶段用到的一个方法,又是防流失的一个办法,还是用特征识别的办法识别有哪些特征的用户流失的可能性高的一个办法。
比如这里面是一个决策树的案例,用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性将更高,达到65%。所以,它是有一个规则,简单写一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道流失的原因。是因为音乐盒的操作次数变少还是别的什么原因。然后,我们有针对性地在这方面做活动或者做一些文章,让他更多地体验这个业务的一些价值点。处于高流失风险状态下的他很可能就会流回来。
另外一个是我们每周都会给对应的用户ID打分,它这周28分,下一周39分。哪一些用户会接触它呢?一是流失分数超过10%,即第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完后要做相应的产品改进,或者对他们做一些促销,或者一些产品运营活动。从决策树上,我们可以看到哪些方面是用户的主要诱因。这是我们产品的一个效果。我们做特征识别以后,点击率比产品经理平常拍脑袋做的点击率都有不同程度地提升,比如75%,88%等,甚至有的达到翻倍地提升。
做完这还不够,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则可以通过数据挖掘算出。
另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来。如果用户来到这个应用,他满足这个条件,我们后面就可以自动化推荐这个活动。这样,产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等,这样就节省很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品创意上,数据挖掘就更聚焦在准确度上。
上述方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据。我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高,而这这是开放的一个里程碑。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14