大数据应用之数据画像建设-CDA数据分析师官网

热线电话：13121318867

大数据应用之数据画像建设

2017-01-21

大数据应用之数据画像建设

大家经常听到一个词，叫做“画像”，结合具体对象就是：“用户画像”、“商品画像”、“产品画像”、“资产画像”、……。特别是大数据时代下，在实际企业中，利用大数据进行“画像”建设是企业经营的基础，建设企业竞争优势重要的工具之一，当然也是大数据在企业应用最价值重要的场景之一。

去评价一家企业数据化运营程度，或者说数据驱动程度，或者说是否是用“数据说话”。也许尝试问下面几个问题可以进行评估：

1、是否建设了“画像”?

2、“画像”体系构建程度，针对什么对象进行了画像。

3、如何应用已经构建好的”画像”，已经构建画像的各种标签与指标。

4、……

画像为什么对企业那么重要，如何进行画像建设，我会后续把相关经验分享给大家，这篇文本更多从一些案例，让大家对于用户画像建设有直接的感觉。

标签是画像建设的基础

画像的建设过程分成下面几部分：

在画像建设中，标签的构建是关键。本文重点来讲数据标签的建设。标签是各类数据指标结合具体的应用/业务场景来构建，如果没有应用场景构建出来的标签往往就很难“落地“。

我们下面讲二个案例来说明数据标签建设过程：

案例一：用户的商品价格偏好标签

某公司的业务团队想要了解用户的消费偏好是怎么样的。当业务团队说我们要构建用户消费偏好画像的时候，往往是指各种场景下用户是如何选择做出选择的，所以需要具体把偏爱画像拆分成几个不同数据标签：

我们以价格偏好为例，也就是说用户的在购物时候偏好于哪个价格带的商品。对于价格带的偏好，构建步骤如下：

取用户历史购买消费记录，统计用户历史购买商品的价格，然后对价格进行区间划分。看用户购买的价格带主要集中在哪个区间中(价格带偏爱应该是一个相对动态的标签，更新频率可能一个月需要定期更，而且选择的时间段也应该是过去某个时间，不应该选择过长时间段。大家想想为什么?)。如何进行价格区间划分?

方法一：按统计学的方法：

1、按分位数进行。例如：25%，50%，75%

2、按等箱原则。划分几等分

3、看数据的分布。

4、……

方法二：按业务知识经验

把价格带按业务经验，行业经验进行划分。

通过数据统计出来，我们可以看用户是否商品单价是否集中的某个区间范围内。例如,某用户购买的商品价格主要集中在30到40这个区间内，根据历史显示可以说，用户可能偏好于购买这个价格带的商品。当未来我们需要做促销商品推荐的时候，可以向该用户重点推荐打折后在这个价格区间的商品。

通过用户购买的价格区间，以及结合商品所归属的品类，可以看这个价格区间在这个品类中属于什么级别的。可以进一步给用户打上：注重品牌、注重高性价比等标签。

例如：如果某个品类商品的价格范围是(5，40]，该用户购物商品主要集中(30，40]这个商品价格区间，用户在这个品类的消费上都是最高价格区间，说明这个用户在购买这个品类主要购买的高端商品。这样又可以为这个用户打上在这个品类的消费特征标签：品类高端用户。

案例二：用户流失概率标签

我们经常会听说一个数据： “养一个新客户的成本是维护一个老客户成本的5倍?在利润贡献方面，老用户更是新用户的16倍”

当然这个5倍更应该理解为期间，更应该理解为：相对争取一个新客，更应该花时间与精力在维护好一个老客上。为什么呢?(同学们一起思考一下) 做用户运营的同学对于流失用户主要痛点如下：

1、那如何去给用户打上流失概率的标签?

2、如何及时更新这个流失概率的标签?

3、什么时候应该开始需要给流失用户进行营销?

4、针对不同流失概率的用户是否要设计不一样的策略?

5、对潜在流失用户，应该设计什么样的策略?

6、对不同类型流失特征的用户，应该投入的成本多少?

7、…….

对于老客的维护，首先应该及时知道用户的流失概率多少?随时时间的推移流失概率是否有变动，特别是流失概率高的用户要及时进行营销避免真的流失。

流失概率用大数据中机器学习的方法预测，而且根据用户产生的行为可以实时去计算用户流失概率标签(用户的流失概率应该是动态,是否需要非常高的时效性，还要结合具体开发成本)。通知运营同学根据不同的用户特征，设计好营销策略。当用户满足相应条件时间，会自动促销相应的营销策略，这才是大数据应该有的场景。

我们如何给用户的流失概率打上标签呢?如果你的公司的业务比较稳定，公司的业务有一定周期(这个周期多长，要看你公司的业务模式，是对B还是对C)，我们会使用机器学习/数据挖掘的方法来去计算这个概率是比较准确的，如果业务太新，数据积累太少建模型往往不是一个好的选择。

我们还是以电商为案例背景，这个公司的CRM团队，希望知道用户流失的概率，根据流失概率定期对相关的用户进行营销，降低用户的流失率。如何构建这个模型从而打上流失概率标签，主要步骤如下：

业务理解。与业务沟通分析流失用户特征，用户的生命周期定义。例如：多久没有和公司互动或者交易定义为休眼，多久没有交易认为是流失了。

业务分析。流失用户的可能的原因是什么，根据这些原因，相应去找到或者设计预期指标。例如：如果用户有过差评，流失可能性高。用户经常看到公司商品缺货，流失可能性高。

模型构建。设计流失用户的预测模型。根据之前的业务流程，业务知识的梳理，围绕用户设计一系列的指标，如下图所示，会从各个方面进行指标清洗，放到模型中建模。

本篇文章主要让大家对于数据画像建设有一个直观的感觉，后续的文章中，我们将逐一介绍数据画像更细看步骤和过程。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据特征用户画像机器学习商品推荐数据挖掘

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

大数据应用之数据画像建设

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载