
大数据 如何用大数据实现用户价值的最大化
大数据中的用户分析
首先,我们为什么要去做用户分析?面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以后需要解决的本质问题就是在拿到用户数据之后,如何去经营分析。
对于海量的用户数据来说,最根本的问题应该是从实际中出来,根据解决不同的问题来提取不同的数据,用不同的数据去搭建模型,来进行一系列的运算。对于产品的生产,无论是互联网产品还是实际上的产品,都会面临一个严重的问题,就是如何进行用户体验的优化。用户如何用产品,我们需要的数据就是用户使用数据。
而对于一些利用用户数据做营销的时候,我们想去用的就是行为数据。让我们能够更多的了解用户。他在什么地方出现,喜欢什么样的东西,要做什么事情。这时候我们就需要再用户的生活行为数据找那个抓取我所需要的东西。对于这些数据的使用,我们首先要制作一个数据集。然后拿数据集去进行模型的搭建和预审的运算。最终得出一个可以支持我自己进行决策的结论。
在大数据时代之前,有很多的网站他们就是互联网厂商,已经对用户数据的使用非常娴熟。而现在移动互联来了,用户多了,就会产生更多的用户数据,留在移动互联的平台上。那么从整体数据使用来看,我们还是可以区分的。无论数据使多么庞大,是什么样的维度,对于用户数据的使用目的不会发生太大的变化。
当我拿到用户数据以后,测算体系已经完善了。就能够做一系列的对内、对外的数据使用。对内是进行产品的完善,提升用户体验。产品完善分为两个部分,首先是对业务运营的监管。第二是对用户体验的优化。
对于业务运营监控预计用户的体验优化,使用的数据使完全不一样的。对于业务运营的监控来说,我需要的是用户在我的产品上使用的时长、频次等。这些数据才有意义。
用用户数据说话也不仅仅是做对内的服务,对外的服务也需要用户的数据去做支撑。对外的服务主要包括的方向就是去进行一些信息化的营销和数据服务。
对于精细化营销来说,移动互联时代,所有的App都在移动互联上。也就是说,所有的App都是属于一个媒体。现在也有很多人都在说媒体已经死了,开始转做一些外延的社区了、但是,媒体的定义应该是信息沟通的平台,这样的平台才叫做媒体。
为什么提到媒体?因为对于营销而言,媒体形式非常突出。当我们在给一个App做定义的时候,它就有了媒体属性。那么我们才能够真正的去做营销。做营销的时候,我们需要了解到这个平台上的用户到底是什么样的人。我们现在提到的精准化营销无非就是给用户打上一些列的标签,进行分类,然后进行精准的推送。
2基于体系外部数据的用户画像
对于用户画像来说,它包括两部分。第一部分是用户行为画像。第二部分是用户心理画像。对于用户的行为画像,需要去给用户进行一系列的标签化处理。还想来说的话哦那么呃它是需要去。给用户去进行一系列的这种表象化的处理啊!彪说用户在。比如用打车类应用的人群,我就直接把它定义成打车类的人群。对于用户的心理画像,就是一些标签的运算了。我如何去进行标签化的运算,然后用这个标签去影射用户的心理,这目前还在发展之中。
那么问题来了,用户标签是不是固定的?用户的标签不是固定的,有的人喜欢去旅游,有的人喜欢去远足,有的人喜欢骑行。这个是通过一些数据是可以判定得到的。甚至包括他平时喜欢去看新闻还是八卦,都是可以得到的。
但是也存在一个问题。举个例子。如果这个人看新闻咨询,今天看的是武器装备类的新闻,明天看的是古代历史分析的文章。如果是机器打标签,可能会给他打上一个军队爱好者和历史爱好者的标签。但是其实他就是一个喜欢军事的人。我们在进行标签处理的时候,标签划分的比较细,没有对用户的心理进行分析。
所以这种情况下,对于这个人自己的心理标签是没有打上去的。这种情况下,你自己打的标签或者是你运算出来的数据,是有很大的缺失的。我做用户画像,其实就是去给他打标签。希望能更加精准的、更加有个性的去推荐。但是这种推荐,是一门技术。这种技术并不能够让用户感知到。用户所感知到的是你在这个技术的基础上的创意。
这种创意才是你和用户去进行沟通的最直接的工具,最能够贴近用户。我们现在做精细化推送,最重要的是如何吸引用户。如何去和用户去沟通起来,互动起来,这才是创意最根本的。
刚才说的是用户的数据能做什么,现在我们来看一下用户数据的构成。用户数据是怎么产生的呢?只要触网就会产生数据大家都知道。那么另一块就是从我们的PPT来看,我们经常会忽略一些数据。那我们现在把整个用户数据分为体系外和体系内的数据。体系内的数据,指的是一个用户在一个网站或者在一个App上的使用行为。比如一个用户在微信上的行为。体系外的用户行为主要是用户在离开App以后,他的行为是什么样的。
那么我们就以微信为例,每一个人都在用微信。但是并不是说你只要上移动互联,你就会在微信里呆着,虽然微信很想去做成一个大大的生态系统,但是用户还是不会把所有的时间都放在微信上。这个时候就有问题了,当这个用户离开微信以后去了什么地方?这个才是我们所需要去更加关心的。比如说这个人他在微信里面喜欢去看一些理财的信息,但是当他离开微信以后他并没有使用理财的App。那么这个时候,我们其实可以把他定义成能够成为一个理财爱好者。但是他并不是一个真正的理财者。
所以我们只是从体系内的数据去判断用户,是远远不够的。比如在新闻客户端去进行广告投放,依据一般都是用户在新闻客户端上都会看什么咨询。比如今日头条。今日头条现在的用户渗透率非常的高。对于今日头条来说,他是通过一些算法把用户喜欢的信息推送给用户的。这是没有问题的,那么问题在哪?
问题在于今日头条给你赠送的这个东西是你喜欢的。那么当他在去给你推送一些广告的时候是不是你需要的?这个就是一个问题了。一些女孩子喜欢看明星的东西。这时候今日头条可能会把这个明星代言的商品去推送给她。但是其实她只是喜欢看一些八卦类的消息。她更多的行为是在外出旅游。这个时候你把化妆品、家居用品推送给她显然是不合适的。
但是如果你把掌握住了她出去旅游的数据,又拿到了她喜欢的明星的数据。二者结合,你就完全可以去给他推荐一些比如防晒霜、户外化妆品的广告。这时候肯定是女孩子想要的。从一个渠道获取数据,通常会形成孤岛。就只能把各种信息孤岛去进行打通以后,才能够真正的、全面的去把这个用户进行画像。
我们现在提到的这个话题,非常强调体系外的数据的力量。因为体系外的数据是真正的反应了一个用户自己的一个生活形态。这才是真正的用数据说话。这就是我们现在提到“5W+1H”,这完全可以够了出一个完整的用户画像。
3如何使用用户数据?(以互联网产品为主)
4问答部分:
(1)在建立用户画像模型的过程中,区分用户特征的关键点是什么? 应该从哪些方面去寻找用户特征?
其实区分用户特征的关键点并不在于我们用什么样的数据,要去做什么样的模型儿关键点在于我们到底用用户画像分析出来的东西,是为什么去服务?我们去做用户画像的目的是什么,才是最重要的。如果你要去做运营,你才能从做好的用户画像里找到你需要的核心数据。用户的使用时长、跳转的评测等等一系列这样的数据。
(2)用户画像如何验证准确性?正向用户画像(即把数据归纳成分类标签)相信很多文章与技术提过了,但我们在实践中发现很难反向验证(确认归纳的标签直的是这样)。所以我想问有没些可操作性强的验证方法?
文章与技术提过了,但我们在实践中发现很难反向验证(确认归纳的标签直的是这样)。所以我想问有没些可操作性强的验证方法?
还是同样如此,验证用户画像的准确性就是验证用户标签的准确性。目前来说有两种方法。第一种方法是你继续进行广告投放,去看这个用户的查看率是否有变化。如果投放非常准确,说明用户画像或者标签打的就非常准确。如果是你的这种投放出现了一些问题,那可能就还需要进行标签的改进。第一种方法其实就是便签的运算方式和方法。
那么对于标签来说,如果方法计算的模型是非常合理的,能够通过便签去把用户的需求和价值观挖掘出来,就说明你的标签非常准确。反之,牛给用户打的标签就是有问题的。反向去进行验证是非常困难的。就是去反问你打标签的理由是什么?比如我去使用滴滴打车,那么我就一个打车用户,这是一个既定事实,完全不需要反向验证了。除非你对于标签的一些感性的认知去进行分析出来以后,才能进行反向验证。
(3)如何衡量一个社区型网站的用户数及其商业价值之间的关系?有没有一些相对普适的计算模型可供参考?
对于社区来说,目前没有一个普适的计算模型的。更多的是看用户在这个社区里面自己的一个关系链以及他自己的活性。这种商业价值其实是一个社区或者说一个社区型网站自己的一个战略。当一个用户在这个社区里面行为非常多,非常丰富,路径也非常长,那、这个时候基本上在每一个节点都有一些商业化的机会。当你把它的每个节点都去进行商业化,那它的商业价值就会挖掘出来。
但如果你对用户的路径非常短。而且这个用户的关系网搭的并不是很广很大,尤其是这种社区网站来说是有问题的。所以说更多的需要去看这个网站里用户的行为和他对于营销的一些行为,对于营销活动的一些行为和他自己在网站里面的一些行为之间的关联强度。通过这种关联性的计算,能够去得到对于某网站的营销价值的测评。但是就整个领域而言是没有一个普适的计算模型的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18