京公网安备 11010802034615号
经营许可证编号:京B2-20210330
网站数据分析:那些难以实现的细分_数据分析师
如果你从事网站分析相关工作,那么你一定用过或听说过网站分析工具中的细分(Segment)功能。不得不说,用好Segment是一名合格的网站分析师必备的技能。关于Segment的重要性,恐怕无需我多言了,借用Sidney的一句话——“无细分,毋宁死!”
However,这次想跟大家分享的,是那些我认为难以实现的细分。这里需要强调下,只是“我认为”,并未向任何官方证实我的这些想法,因此请大家尽管质疑,尽管拍砖。
在用具体的案例来说明问题之前,先简单回顾下细分是如何工作的,下面引用一段Omniture官方文档中的内容,
Segmentation works by scanning through every single hit within the time period selected, checking to see if that image request matches your segmentation rules.
1. If it matches, then that hit will be part of your segment (along with additional data depending on the bucket)
2. If it does not match, the image request is thrown away and treated as if it didn’t exist in the context of the specific report you are viewing
这里要注意下,虽然平时如果你说“把Search Engine按Keyword细分”,大家都明白你的意思,但实际上,很可能潜移默化地就把多维度关联和细分两者的概念混淆了。
好了,废话不多说,直接进入正题。
在同一个会话(Session)中,用户可能对Page A产生了X个Page View(s),那么,是否可以通过细分,得到可以满足下表的数据?
| Page Views of Page A | Visits |
| 0(未查看过Page A的访问) | |
| 1(查看过Page A 1次的访问) | |
| 2(查看过Page A 2次的访问) | |
| … | |
| X(查看过Page A X次的访问) |
我们先尝试第一项,0 Page Views of Page A(未查看过Page A的访问),
很容易地,我们给出了细分规则,即在所有的数据中筛选出排除了访问中访问过Page A的访问(似乎稍有拗口,在用文字表达细分规则的时候我总感觉很吃力,语言难以规范,请见谅了)。也就是说,如果某次访问中包含了Page = Page A的hit,那么,这次访问将不在细分后的数据集中。
事实上,得到这个数据如果不通过细分来实现,也是非常容易,用Total Visits – Visits of Page A,得到的结果便是完全没有访问过Page A的Visits了。
细分后,我们来看看Page A的数据情况,顺便验证下细分是否正确,
(图片已经PS处理,数据为模拟数据)
如上图所示,细分后得到的Total Visits 是9,310,750,而未细分的话,得到的Total Visits是10,041,929,两者之差正好是未细分时Page A的Visits 731,179,因此,细分成功。
顺便提一下,不要试图用下面的规则来得到这个数据,也不要试图把Visit Container修改成Page View Container,想一想为什么吧,我就先不多说了。
接着,我们继续尝试第二项任务,即细分出“看且仅看了Page A 1次的访问”。
我们可能试图用以下规则来实现,
乍一看,还真像那么回事,我们先直接看看结果如何,
(图片已经PS处理,数据为模拟数据)
有没有发现,我们所期望的“看且仅看了Page A 1次的访问”,其结果竟然与Page A Single Page Visits(访问且仅访问了Page A的访问数量)相同,这说明我们的规则:Page Views equals 1,作用于整个visit,限定了符合规则的访问必须仅包含1个Page View,而并非如我们所愿,用于限定Page A的Page Views为1 。
到这里,我想实验可以结束了,之后的任务也同样无法完成了。由于近两年较少使用GA,因此我并不确定GA中是否可以实现这样的细分,但是对于Omniture,我有至少99%的Confidence说这个细分是无法实现的(经过针对性的部署的除外)。
还没完,来试试总结出一个更具普遍性的结论:我们可以细分出某个特定变量发生过特定次数的访问/访客,但无法细分出某个特定变量的某个特定值发生过特定次数的访问/访客。
用这个结论来解释这个案例的话,那就是我们可以细分出Page变量发生过X次(Page Views = X)的访问,但无法细分出Page变量的值为A且发生过X次Page=A的访问。
这个案例就到这里结束了,如果你有任何不同意见,请尽管拍砖,我虽然很坚信这个细分确实无法实现,但我更希望我的想法是错误的。文章来源:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20