京公网安备 11010802034615号
经营许可证编号:京B2-20210330
网站数据分析:那些难以实现的细分_数据分析师
如果你从事网站分析相关工作,那么你一定用过或听说过网站分析工具中的细分(Segment)功能。不得不说,用好Segment是一名合格的网站分析师必备的技能。关于Segment的重要性,恐怕无需我多言了,借用Sidney的一句话——“无细分,毋宁死!”
However,这次想跟大家分享的,是那些我认为难以实现的细分。这里需要强调下,只是“我认为”,并未向任何官方证实我的这些想法,因此请大家尽管质疑,尽管拍砖。
在用具体的案例来说明问题之前,先简单回顾下细分是如何工作的,下面引用一段Omniture官方文档中的内容,
Segmentation works by scanning through every single hit within the time period selected, checking to see if that image request matches your segmentation rules.
1. If it matches, then that hit will be part of your segment (along with additional data depending on the bucket)
2. If it does not match, the image request is thrown away and treated as if it didn’t exist in the context of the specific report you are viewing
这里要注意下,虽然平时如果你说“把Search Engine按Keyword细分”,大家都明白你的意思,但实际上,很可能潜移默化地就把多维度关联和细分两者的概念混淆了。
好了,废话不多说,直接进入正题。
在同一个会话(Session)中,用户可能对Page A产生了X个Page View(s),那么,是否可以通过细分,得到可以满足下表的数据?
| Page Views of Page A | Visits |
| 0(未查看过Page A的访问) | |
| 1(查看过Page A 1次的访问) | |
| 2(查看过Page A 2次的访问) | |
| … | |
| X(查看过Page A X次的访问) |
我们先尝试第一项,0 Page Views of Page A(未查看过Page A的访问),
很容易地,我们给出了细分规则,即在所有的数据中筛选出排除了访问中访问过Page A的访问(似乎稍有拗口,在用文字表达细分规则的时候我总感觉很吃力,语言难以规范,请见谅了)。也就是说,如果某次访问中包含了Page = Page A的hit,那么,这次访问将不在细分后的数据集中。
事实上,得到这个数据如果不通过细分来实现,也是非常容易,用Total Visits – Visits of Page A,得到的结果便是完全没有访问过Page A的Visits了。
细分后,我们来看看Page A的数据情况,顺便验证下细分是否正确,
(图片已经PS处理,数据为模拟数据)
如上图所示,细分后得到的Total Visits 是9,310,750,而未细分的话,得到的Total Visits是10,041,929,两者之差正好是未细分时Page A的Visits 731,179,因此,细分成功。
顺便提一下,不要试图用下面的规则来得到这个数据,也不要试图把Visit Container修改成Page View Container,想一想为什么吧,我就先不多说了。
接着,我们继续尝试第二项任务,即细分出“看且仅看了Page A 1次的访问”。
我们可能试图用以下规则来实现,
乍一看,还真像那么回事,我们先直接看看结果如何,
(图片已经PS处理,数据为模拟数据)
有没有发现,我们所期望的“看且仅看了Page A 1次的访问”,其结果竟然与Page A Single Page Visits(访问且仅访问了Page A的访问数量)相同,这说明我们的规则:Page Views equals 1,作用于整个visit,限定了符合规则的访问必须仅包含1个Page View,而并非如我们所愿,用于限定Page A的Page Views为1 。
到这里,我想实验可以结束了,之后的任务也同样无法完成了。由于近两年较少使用GA,因此我并不确定GA中是否可以实现这样的细分,但是对于Omniture,我有至少99%的Confidence说这个细分是无法实现的(经过针对性的部署的除外)。
还没完,来试试总结出一个更具普遍性的结论:我们可以细分出某个特定变量发生过特定次数的访问/访客,但无法细分出某个特定变量的某个特定值发生过特定次数的访问/访客。
用这个结论来解释这个案例的话,那就是我们可以细分出Page变量发生过X次(Page Views = X)的访问,但无法细分出Page变量的值为A且发生过X次Page=A的访问。
这个案例就到这里结束了,如果你有任何不同意见,请尽管拍砖,我虽然很坚信这个细分确实无法实现,但我更希望我的想法是错误的。文章来源:CDA数据分析师培训官网
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17