京公网安备 11010802034615号
经营许可证编号:京B2-20210330
小白学数据分析--相关分析在充值与购买失衡分析的应
昨天简单的说过充值记录的分析方法,今天介绍一下使用相关分析,说说充值与购买的数据相关分析。在很多类型的游戏中,我们经常会做累计充值活动,然而并不是所有的累计充值活动都做的很好,而且某些类型的游戏不适合频繁作累计充值活动,究其原因,其中之一就是会造成充值与购买的失衡,通俗的说就是会存在持币待购的情况,我们希望正常或者良性的循环是充值购买为1:1,这点对于平衡消费,稳定消费结构很重要,当然了实际运营中我们也会面临很多的突发因素,比如游戏内容调整,游戏数值调整,版本IB刺激等等。但是如果出现持币待购也就是说充值远远大于购买时,我们就需要警惕和分析原因。
但是我们如何来判定和量化持币待购的情况?这里我们将采用相关分析的方法来解决。所谓相关分析(Correlation Analysis)是考察两个变量的相互变化的关系程度,与回归分析不同的是,相关分析的两个变量地位是平等的,不存在因果关系。相关关系是变量之间保持某种不确定的依存关系,相关分析可以借助散点图或者诸如相关系数来考察变量间的关联程度。
变量的相关关系按照两者的变动分为正相关和负相关,正相关也就是相关系数为正,两个因素同方向变动,一个增大另一个也增大,而负相关就是相关系数为负,两个因素按照反方向变动,一个增大另一个却反而减小。
按照相关的程度来看,相关关系可以分为完全相关、不相关和不完全相关。当一个变量变化完全由另一个变量决定时,这种关系为完全相关;如果彼此互不影响,变量各自独立,就是不相关;而两个变量之间关系介于完全相关和不相关之间就是不完全相关。
关于描述相关系数的方法有很多种,这里不再讲解,一般而言我们比较关注相关分析按照影响因素(变量)如何确定分析方法,对于我们今天讨论的充值购买的相关分析就是双变量相关分析,即通过计算两个变量之间的相关系数,对两个变量之间是否显著相关做出判断。另外还有偏相关分析,当出现多个变量时,直接对两个变量进行相关分析往往不能真实反映二者之间的相关关系,这时就需要用偏相关分析,剔出其他变量的线性影响。最后一种是距离分析,当出现了多个变量而不能每个分析解决时,此时将所有的变量按照一定的标准分类,即聚类分析。
相关分析在Excel和SPSS中均有相关的模块可用于分析,今天说说在Excel中怎么使用相关分析,在Excel中判断相关关系的方法有两种,即散点图和相关关系分析工具。散点图这里就不再累述了,简单说说相关关系分析工具的使用。
首先在Excel中把数据分析模块调用出来,点击开始,选择Excel选项

选择加载项|分析工具库|转到

之后打开如下的对话框,选择分析工具库,点击确定,最后会在数据标签下出现数据分析的加载项。

随后选择数据分析|相关系数,出现相关系数对话框。在输入区域需要输入分析数据区域的单元格引用,且引用数据区域必须是两个或者以上的行或者列的相邻数据区域。这里我们选取某一月的每名玩家的充值总额和该月相应的购买总额。
分组方式是数据区域是按照行或者列排列,单击逐行或者逐列。
标志位于第一行/标志位于第一列,如果输入区域的第一行显示变量名,选中标志位于第一行,列的形式一样。如果输入区域没有变量,无需选择。
之后会输出一个相关分析结果的表格,该表格会把两个变量的相关系数计算出来,根据计算的系数就能够了解充值总额和购买总额的相关系数。相关系数一般会呈现两种结果。
正相关:随着充值总额的增加,购买总额也增加,此时充值和购买的平衡保持较稳(当然这种分析不是绝对的,不要只限于用这一种方法就断言充值购买的平衡性,还要结合其他数据来看待,切忌)
负相关:随着充值的增加,购买反而减少,呈反向变化趋势,此时为充值购买不平衡的情况出现,可以作为一个参考指标。
p.s.做这种相关分析要注意维度的把握,比如是新登玩家、回流玩家等等,可以更加明确的分析和把握客群特点,因为在APA群体中,发生充值购买失衡不一定是整个的APA群体,不断地细分APA客群,可以更好地进行分析。进而当我们找到了充值购买失衡最为严重的APA群体后,在通过聚类分析、RFM分析等更加深刻描述和分析问题。这是一个系列的过程,相关性的分析只是在第一步把充值购买的失衡问题暴露出来,这只是一种手段,但不是唯一。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28