京公网安备 11010802034615号
经营许可证编号:京B2-20210330
电子商务数据分析师(数据挖掘)
14年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。
就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。
最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。
后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法:
1、 RFM模型
模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情:
⑴ 建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动
⑵ 发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。
⑶ 在短信、EDM促销中,可以利用模型,选取最优会员。
⑷ 维系老客户,提高会员的忠诚度。
使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。
2、 关联分析
关联分析最原始的案例来自于沃尔玛的“啤酒与尿布”。通俗意义上讲,就是只买了A商品的人,又有很多人买了B商品,那么我们就可以认为A、B两个商品的关联性比较高。很多数据挖掘工具都有关联挖掘,主要使用的算法是Apriori算法,在计算的过程中会主要考察项集、置信度、相关性这三个结果数据,以最终确定商品之间的相关性。除了Apriori算法外,还有许多其他的关联分析的算法,基本上也都是从Apriori发展而来,比如FPgrowth。本人从几年的数据分析经验感觉,关联分析在零售业中并不太实用,挖掘出来的关联度比较高的商品一般都是同类商品或者同品牌的商品,像“啤酒与尿布”这种,很少能够有。
使用方法:组套销售或者相关陈列等。
3、 聚类分析
零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主要有两种K-means聚类和系统聚类。也可以在数据仓库中根据顾客购买的商品属性进行会员的聚类分析,这里就不需要算法的支持,只需要根据系统的已经有的商品分类,把购买过相同商品类别的顾客划分到一起。这种方法可能与公司的业务更加贴近。聚类分析是进行会员精细化管理,精细化营销的基础,做好聚类分析,对企业将有很大的益处。
使用方法:对顾客细分,精准化营销。
4、“之”字分析法
该种方法主要是有一种很明确的会员群体,然后通过分析这些会员群体的购买行为,提取这些购物行为的相似点,然后再通过这些相似点返回到整个数据里面,从中抽取更大的会员群体,以制定精准的营销。
再后来,公司又上了SAP,又去BW组去做报表开发,做报表开发这一块能够接触到更多的业务方面的知识,虽然做数据挖掘比较少了,但是数据最终是要指导业务的,所以这对我的成长也算是非常有利的。业务方面主要了解到了几大块:
1、库存管理-库存管理这块主要有正品库存的管理,滞销库存,高库存商品等各种不同类型的库存该怎么定义以及该如何去管理。比如去管理供应商的库存的时候会根据正品库存及滞销库存和库存正常的周转天数来计算该供应商的库存是否在合理的水平,是否该进货还是要减少库存。
2、促销管理-促销管理是以提高销售额为目的,吸引、刺激消费者消费的一系列计划、组织、领导、控制和协调管理的工作。数据方面来说主要是针对不同的促销方式来计算不同的方式收益情况,不同的促销方式可以带来不同的效果,因此在使用促销的时候要审慎的选择,以达到理想的效果。
另外,还有财务报表、采购流程等很多方面的东西,这些接触的比较少就不写啦。
在BW项目组的时候,也经常会帮网站做一些分析工作,自己也自学了两本关于网站数据分析方面的书,感觉学到了一些皮毛,下面说一下吧:
1、 网站流量分析
网站流量的比较重要的KPI指标有浏览量、访问量、独立访客数、跳失率、转化率、页面停留时间、访问页面数、流量来源、流量来源ROI等等。通过这些数据可以全面的反映网站的整体情况。其中跳失率可以用来衡量页面的质量,流量来源及转化率可以衡量市场及营销的工作情况。进行网站数据分析的时候,需要牢牢的把握转化率这一指标,然后由这一指标的变化来寻找其他相关数据的变化,最终找出原因,做相对应的策略,改进我们的工作。
2、 网站分析细分
数据分析行业有句话-无细分,毋宁死,足矣看出细分对数据分析意义。对于网站的数据分析尤其是如此。网站的流量数据量非常大,从整体上看根本都看不出那里会出现问题,所以必须要细分。比如说营销人员需要看的转化率,必须就要细分到每个渠道里面,然后再看到这些渠道来的会员的点击情况,他们都看过那些网页,对什么感兴趣,跳失率是多少,浏览时间多长,最终转化的是多少等等,这样才能看出问题。
3、 网站的短信促销及EDM
在这个电子商务普遍烧钱的时代,花出去的钱到底能有多少能够带来实际的收益呢?在抢占市场的同时,怎么才能做到ROI最大化这个问题急需要解决。公司每天几乎都要发几万条甚至几十万条的促销的短信,短信的反馈率基本上都在2%一下,怎么才能提高转化率,这就需要更精准的用户定位,把钱花到最有可能带来收益的地方。因此网站的短息促销及EDM促销,必须要依据会员的精细化细分,不但要满足客户的需求,更要挖掘出他们的需求。
写到这里基本上写的差不多,通过总结才发觉自己原来很是知道的很少,还有很多需要学习的地方,比如说数学建模方面的知识不够,统计学软件使用不够好,业务了解的不够深入,对整个电子商务行业的发展把握不清晰,这些都是需要以后加强的地方。最近在一个数据分析师的前辈的博客上看到他对数据分析师的要求只有一点,就是要热爱数据。感觉自己还不够,平时工作的时候还不够投入,总觉得是在为公司工作,不是在为自己的兴趣工作,其实一个人每天做的事,一定要都当做是为自己做才行,就算真的不是为自己做,也要从中学到一些东西来变成自己的东西,为自己服务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28