京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用之数据画像建设
大家经常听到一个词,叫做“画像”,结合具体对象就是:“用户画像”、“商品画像”、“产品画像”、“资产画像”、……。特别是大数据时代下,在实际企业中,利用大数据进行“画像”建设是企业经营的基础,建设企业竞争优势重要的工具之一,当然也是大数据在企业应用最价值重要的场景之一。
去评价一家企业数据化运营程度,或者说数据驱动程度,或者说是否是用“数据说话”。也许尝试问下面几个问题可以进行评估:
1、是否建设了“画像”?
2、“画像”体系构建程度,针对什么对象进行了画像。
3、如何应用已经构建好的”画像”,已经构建画像的各种标签与指标。
4、……
画像为什么对企业那么重要,如何进行画像建设,我会后续把相关经验分享给大家,这篇文本更多从一些案例,让大家对于用户画像建设有直接的感觉。
标签是画像建设的基础
画像的建设过程分成下面几部分:
在画像建设中,标签的构建是关键。本文重点来讲数据标签的建设。标签是各类数据指标结合具体的应用/业务场景来构建,如果没有应用场景构建出来的标签往往就很难“落地“。
我们下面讲二个案例来说明数据标签建设过程:
案例一:用户的商品价格偏好标签
某公司的业务团队想要了解用户的消费偏好是怎么样的。当业务团队说我们要构建用户消费偏好画像的时候,往往是指各种场景下用户是如何选择做出选择的,所以需要具体把偏爱画像拆分成几个不同数据标签:
我们以价格偏好为例,也就是说用户的在购物时候偏好于哪个价格带的商品。对于价格带的偏好,构建步骤如下:
取用户历史购买消费记录,统计用户历史购买商品的价格,然后对价格进行区间划分。看用户购买的价格带主要集中在哪个区间中(价格带偏爱应该是一个相对动态的标签,更新频率可能一个月需要定期更,而且选择的时间段也应该是过去某个时间,不应该选择过长时间段。大家想想为什么?)。如何进行价格区间划分?
方法一:按统计学的方法:
1、按分位数进行。例如:25%,50%,75%
2、按等箱原则。划分几等分
3、看数据的分布。
4、……
方法二:按业务知识经验
把价格带按业务经验,行业经验进行划分。
通过数据统计出来,我们可以看用户是否商品单价是否集中的某个区间范围内。例如,某用户购买的商品价格主要集中在30到40这个区间内,根据历史显示可以说,用户可能偏好于购买这个价格带的商品。当未来我们需要做促销商品推荐的时候,可以向该用户重点推荐打折后在这个价格区间的商品。
通过用户购买的价格区间,以及结合商品所归属的品类,可以看这个价格区间在这个品类中属于什么级别的。可以进一步给用户打上:注重品牌、注重高性价比等标签。
例如:如果某个品类商品的价格范围是(5,40],该用户购物商品主要集中(30,40]这个商品价格区间,用户在这个品类的消费上都是最高价格区间,说明这个用户在购买这个品类主要购买的高端商品。这样又可以为这个用户打上在这个品类的消费特征标签:品类高端用户。
案例二:用户流失概率标签
我们经常会听说一个数据: “养一个新客户的成本是维护一个老客户成本的5倍?在利润贡献方面,老用户更是新用户的16倍”
当然这个5倍更应该理解为期间,更应该理解为:相对争取一个新客,更应该花时间与精力在维护好一个老客上。为什么呢?(同学们一起思考一下) 做用户运营的同学对于流失用户主要痛点如下:
1、那如何去给用户打上流失概率的标签?
2、如何及时更新这个流失概率的标签?
3、什么时候应该开始需要给流失用户进行营销?
4、针对不同流失概率的用户是否要设计不一样的策略?
5、对潜在流失用户,应该设计什么样的策略?
6、对不同类型流失特征的用户,应该投入的成本多少?
7、…….
对于老客的维护,首先应该及时知道用户的流失概率多少?随时时间的推移流失概率是否有变动,特别是流失概率高的用户要及时进行营销避免真的流失。
流失概率用大数据中机器学习的方法预测,而且根据用户产生的行为可以实时去计算用户流失概率标签(用户的流失概率应该是动态,是否需要非常高的时效性,还要结合具体开发成本)。通知运营同学根据不同的用户特征,设计好营销策略。当用户满足相应条件时间,会自动促销相应的营销策略,这才是大数据应该有的场景。
我们如何给用户的流失概率打上标签呢?如果你的公司的业务比较稳定,公司的业务有一定周期(这个周期多长,要看你公司的业务模式,是对B还是对C),我们会使用机器学习/数据挖掘的方法来去计算这个概率是比较准确的,如果业务太新,数据积累太少建模型往往不是一个好的选择。
我们还是以电商为案例背景,这个公司的CRM团队,希望知道用户流失的概率,根据流失概率定期对相关的用户进行营销,降低用户的流失率。如何构建这个模型从而打上流失概率标签,主要步骤如下:
业务理解。与业务沟通分析流失用户特征,用户的生命周期定义。例如:多久没有和公司互动或者交易定义为休眼,多久没有交易认为是流失了。
业务分析。流失用户的可能的原因是什么,根据这些原因,相应去找到或者设计预期指标。例如:如果用户有过差评,流失可能性高。用户经常看到公司商品缺货,流失可能性高。
模型构建。设计流失用户的预测模型。根据之前的业务流程,业务知识的梳理,围绕用户设计一系列的指标,如下图所示,会从各个方面进行指标清洗,放到模型中建模。
本篇文章主要让大家对于数据画像建设有一个直观的感觉,后续的文章中,我们将逐一介绍数据画像更细看步骤和过程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14