京公网安备 11010802034615号
经营许可证编号:京B2-20210330
很多小伙伴都计划年后换工作,为了帮助各位学习数据分析的小伙伴们成功拿到offer!本期给大家整理了一些数据分析面试时的高频问题,希望大家积极点赞收藏加关注,一起冲鸭~
1、APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,如何评估活动效果?
【参考答案】
如果要对一个活动效果进行分析,无非是要回答以下3个问题:
(1)活动效果怎么样?要不要继续做?
(2)如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?
(3)针对问题环节的改进方案是什么?
具体展开来讲,可以从以下几个方面:
(1)活动关键指标达成分析
活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
(2)活动关键流程漏斗分析
活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。
(3)活动的渠道、用户分析
活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
(4)活动策略、节奏分析
活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。
2、业务场景题,如何分析次日留存率下降的问题
【参考答案】
业务问题关键是问对问题,然后才是拆解问题去解决。
(1)两层模型
从用户画像、渠道、产品、行为环节等角度细分,明确到底是哪里的次日留存率下降了
(2)指标拆解
次日留存率 = Σ 次日留存数 / 今日获客人数
(3)原因分析
内部:运营活动、产品变动、技术故障、设计漏洞(如产生可以撸羊毛的设计)
外部:竞品、用户偏好、节假日、社会事件(如产生舆论)
3、谈谈RFM用户模型
【参考答案】
RFM模型是客户关系管理(CRM)中一种被广泛使用的营销模型,它是衡量客户价值和客户创利能力的重要工具和手段。
RFM模型主要通过3个指标来描述一个客户的价值:
✅ 最近一次消费时间(Recency),缩写为R
✅ 消费频次(Frequency),缩写为F
✅ 消费金额(Monetary),缩写为M
在具体的应用中,一般是通过R、F、M这3项值将买家进行分层,卖家可以对不同层级的用户采取不同的营销方式~
利用RFM模型划分用户层级,可以进行客户细分、寻找目标客户:
⭕重要价值客户,RFM都很大,优质客户,需要保持
⭕重要发展客户,低活高购高价值,交易金额和交易次数大,但最近无交易。需要发展
⭕重要保持客户,高活低购高价值,交易金额大贡献度高,且最近有交易。需要重点识别
⭕重要挽留客户,低活低购高价值:交易金额大,潜在的有价值客户,需要挽留、促活。
这一模型的【优点】:
✔能够快速对某段时间内的付费用户做用户分类,响应快速的业务需求;
✔能直观了解用户消费的质量,短时间监控大客户的流失情况,及时做出挽回应对措施;
✔能及时发现新的大客户,比如频次低但额度大的用户。
4、什么是假设检验?
【参考答案】
参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。
(1)参数估计讨论的是用样本估计总体参数的方法,总体参数μ在估计前是未知的。
(2)而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
5、 置信度、置信区间
【参考答案】
置信区间是我们所计算出的变量存在的范围,水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。
(1)举例来讲,有95%的把握,真正的数值在我们所计算的范围里。在这里,95%是置信水平,而计算出的范围,就是置信区间。
(2)如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。
6、 扑克牌54张,平均分成2份,求这2份都有2张A的概率
【参考答案】
这个问题可以通过计算概率来解决:
有2张A的概率可以通过组合来计算,即从4张A中选取2张A的组合数除以从54张牌中选取2张的组合数:P(2张A) = C(4, 2) / C(54, 2) 其中,C(n, m)表示从n个元素中选取m个元素的组合数。
我们需要将剩下的52张牌平均分成2份,每份26张。其中,有2张A的概率可以表示为:P(2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A) 假设第一份有2张A,第二份没有A,那么从剩下的50张牌中选出24张牌来组成第一份,剩下的26张牌自然组成第二份。这种情况的概率为:P(1份有2张A,另1份没有A) = C(4, 2) * C(50, 24) / C(54, 26)
(3)同样的道理,当第一份没有A,第二份有2张A时,这种情况的概率也是:P(1份没有A,另1份有2张A) = C(4, 0) * C(50, 26) / C(54, 26)
(4)最后,将两种情况的概率相加即可得到答案:P(两份都有2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A)代入计算,即可得到最终的概率。
7、做过AB test吗,谈谈原理?
【参考答案】
ABtest的本质其实是两个总体的假设检验问题。这个测试很多教育机构作业帮、学而思等经常用,用来测试哪些课程组合比较受欢迎等。当我们现在有两种方案,方案A和方案B,我们想要知道哪种方案更好,那我们就要做ABtest,也就是要做假设检验。
✅假设检验的步骤如下:
(1) 根据检验目的,构造原假设和备择假设
(2) 构造检验统计量
(3)给出显著性水平,根据样本数据,计算检验统计量的值.
(4)得出检验的结果,拒绝原假设还是没有充分的理由拒绝原假设
✅AB test具体场景问题:
AB test效果不显著,你该怎么判断这个实验的收益?
AB test中实验组核心指标明显优于对照组,那么这个优化就一定能够上线嘛?
AB test时效果显著,但是全量上线时,效果平平,问题在哪里?
AB test效果不显著时,那么是否可以判断这个实验失败了,没有意义?
一般的AB test场景问题都可以从以下几个理由中得到解释:辛普森悖论、新奇效应、以偏盖全、以全盖偏、正交互斥实验。
8、APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?
【参考答案】
(1)如果渠道使用时间较长,认为渠道的app激活量满足一个分布,比较可能是正态分布。求平均值和标准差,对 于今日数值与均值差大于3/2/1个标准差的渠道进行预警。
(2)对于短期的新渠道,直接与均值进行对比。
9、用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?
【参考答案】
可以采用技术接受模型(TAM)来分析,影响用户接受选择属性这件事的主要因素有:
(1)感知的有用性(perceived usefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度; 感知有用性:文案告知用户选择属性能给用户带来的好处
(2)感知的易用性(perceived ease of use),反映一个人认为容易使用一个具体的系统的程度。
感知易用性: a. 关联用户第三方账号 (如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。b. 交互性做好。
(3)使用者态度:用户对填写信息的态度 a. 这里需要允许用户跳过,后续再提醒用户填写 b. 告知用户填写的信息会受到很好的保护
(4)行为意图:用户使用APP的目的性,难以控制
(5)外部变量:如操作时间、操作环境等,这里难以控制
10、卖玉米如何提高收益?价格提高多少才能获取最大收益?
【参考答案】
根据公式收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销量。
(1) 提高单位溢价的方法:
品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;
(2)重定位商品,如礼品化等;
价格歧视,根据价格敏感度对不同用户采用不同定价。
销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。
收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14