京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一位电商数据分析师的经验总结_数据分析师培训
08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。
就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。
最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。
后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法:
1、 RFM模型
模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情:
⑴ 建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动。
⑵ 发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。
⑶ 在短信、EDM促销中,可以利用模型,选取最优会员。
⑷ 维系老客户,提高会员的忠诚度。
使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。
2、 关联分析
关联分析最原始的案例来自于沃尔玛的“啤酒与尿布”。通俗意义上讲,就是只买了A商品的人,又有很多人买了B商品,那么我们就可以认为A、B两个商品的关联性比较高。很多数据挖掘工具都有关联挖掘,主要使用的算法是Apriori算法,在计算的过程中会主要考察项集、置信度、相关性这三个结果数据,以最终确定商品之间的相关性。除了Apriori算法外,还有许多其他的关联分析的算法,基本上也都是从Apriori发展而来,比如FPgrowth。本人从几年的数据分析经验感觉,关联分析在零售业中并不太实用,挖掘出来的关联度比较高的商品一般都是同类商品或者同品牌的商品,像“啤酒与尿布”这种,很少能够有。
使用方法:组套销售或者相关陈列等。
3、 聚类分析
零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主要有两种K-means聚类和系统聚类。也可以在数据仓库中根据顾客购买的商品属性进行会员的聚类分析,这里就不需要算法的支持,只需要根据系统的已经有的商品分类,把购买过相同商品类别的顾客划分到一起。这种方法可能与公司的业务更加贴近。聚类分析是进行会员精细化管理,精细化营销的基础,做好聚类分析,对企业将有很大的益处。
4、“之”字分析法
该种方法主要是有一种很明确的会员群体,然后通过分析这些会员群体的购买行为,提取这些购物行为的相似点,然后再通过这些相似点返回到整个数据里面,从中抽取更大的会员群体,以制定精准的营销。
再后来,公司又上了SAP,又去BW组去做报表开发,做报表开发这一块能够接触到更多的业务方面的知识,虽然做数据挖掘比较少了,但是数据最终是要指导业务的,所以这对我的成长也算是非常有利的。业务方面主要了解到了几大块:
1、库存管理-库存管理这块主要有正品库存的管理,滞销库存,高库存商品等各种不同类型的库存该怎么定义以及该如何去管理。比如去管理供应商的库存的时候会根据正品库存及滞销库存和库存正常的周转天数来计算该供应商的库存是否在合理的水平,是否该进货还是要减少库存。
2、促销管理-促销管理是以提高销售额为目的,吸引、刺激消费者消费的一系列计划、组织、领导、控制和协调管理的工作。数据方面来说主要是针对不同的促销方式来计算不同的方式收益情况,不同的促销方式可以带来不同的效果,因此在使用促销的时候要审慎的选择,以达到理想的效果。
另外,还有财务报表、采购流程等很多方面的东西,这些接触的比较少就不写啦。
在BW项目组的时候,也经常会帮网站做一些分析工作,自己也自学了两本关于网站数据分析方面的书,感觉学到了一些皮毛,下面说一下吧:
1、 网站流量分析
网站流量的比较重要的KPI指标有浏览量、访问量、独立访客数、跳失率、转化率、页面停留时间、访问页面数、流量来源、流量来源ROI等等。通过这些数据可以全面的反映网站的整体情况。其中跳失率可以用来衡量页面的质量,流量来源及转化率可以衡量市场及营销的工作情况。进行网站数据分析的时候,需要牢牢的把握转化率这一指标,然后由这一指标的变化来寻找其他相关数据的变化,最终找出原因,做相对应的策略,改进我们的工作。
2、 网站分析细分
数据分析行业有句话-无细分,毋宁死,足矣看出细分对数据分析意义。对于网站的数据分析尤其是如此。网站的流量数据量非常大,从整体上看根本都看不出那里会出现问题,所以必须要细分。比如说营销人员需要看的转化率,必须就要细分到每个渠道里面,然后再看到这些渠道来的会员的点击情况,他们都看过那些网页,对什么感兴趣,跳失率是多少,浏览时间多长,最终转化的是多少等等,这样才能看出问题。
3、 网站的短信促销及EDM
在这个电子商务普遍烧钱的时代,花出去的钱到底能有多少能够带来实际的收益呢?在抢占市场的同时,怎么才能做到ROI最大化这个问题急需要解决。公司每天几乎都要发几万条甚至几十万条的促销的短信,短信的反馈率基本上都在2%一下,怎么才能提高转化率,这就需要更精准的用户定位,把钱花到最有可能带来收益的地方。因此网站的短息促销及EDM促销,必须要依据会员的精细化细分,不但要满足客户的需求,更要挖掘出他们的需求。
写到这里基本上写的差不多,通过总结才发觉自己原来很是知道的很少,还有很多需要学习的地方,比如说数学建模方面的知识不够,统计学软件使用不够好,业务了解的不够深入,对整个电子商务行业的发展把握不清晰,这些都是需要以后加强的地方。最近在一个数据分析师的前辈的博客上看到他对数据分析师的要求只有一点,就是要热爱数据。感觉自己还不够,平时工作的时候还不够投入,总觉得是在为公司工作,不是在为自己的兴趣工作,其实一个人每天做的事,一定要都当做是为自己做才行,就算真的不是为自己做,也要从中学到一些东西来变成自己的东西,为自己服务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12