京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据应用因小而美
从去年年底,我开始思考怎么从“用数据”转变为“养数据”(即数据运营转变为运营数据),这一段时间我特别为收集什么样的数据而烦恼(more data, more problem)。而且,我也曾经想做一个特别大的适合多数人使用的数据应用出来(虚火上升),可是后来发现这在数据应用的起步阶段几乎是不可能的,一是找到可以解决大部分人需求的数据应用不容易,二是支付宝的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。
所以,我总结,当做数据应用的时候,数据就是等于原材料,当原材料一直处于变化的情况下,做出来的产品很容易出问题。体会数据和应用的关系之后,我最后决定从小角度切入,先做小应用出来(很好的瞄准器)。
这里说的“小”指的是应用的目标很具体。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好,差异在哪里,是很具体的问题。但如果我的目标是想知道如何让公司赢利,就是一个空泛的目标。
还请注意,“小”不是指数据量。许多人在没有获取足够数据,并且缺乏对数据理解的情况下做判断,其实是在享受自己的无知。
经过一番周折之后,也是按照小角度切入的想法设计数据应用,小角度切入设计产品可以做到具体和快速,而且可以避免因原材料的变化而导致的问题。
把数据放进“框”之中
此外,还不得不说到一个话题,在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(情景)里面看才能看出问题。
为了把问题说得很明白,这里我拿前阵子一家电商公司找我讨论的问题举例子。这里不太方便公开这家公司的名称,暂以A公司代替。
A问我,要不要撤去导航网站的广告?因为怀疑许多老客户是从导航网站访问官网,而不是直接访问官网。
把这个问题说得再直白点,就是要弄清楚在导航做广告与A公司的业务关系。
那么,接下来要观察用什么“数据框架”,有助于做决策?
一、A公司当前的投入产出比
1、明确导航网站引进来的新、老用户占比如何?
2、引入的新、老用户的投入产出比和转化率如何?
3、推断撤去导航网站,对流失新老用户的影响?
二、与竞争对手的博弈
有一个问题可能会忽略,那就是你不做导航网站广告,你的对手就会立马进来。做数据框架的时候,要特别注意框架不是静态的,而是博弈的,需要把竞争对手因素算进来。
三、考虑时间因素
建立框时要考虑时间因素:
1、 用现在、过去和未来的眼光来审视导航网站,看看导航的质量是不是越来越好
2、 需要注意的是时间有延迟性,引进来的流量会有一些延迟,在两三个月后才能知道新用户的价值(life time value)。
总之,“数据框架”是商业分析师的灵魂所在,从框中找寻问题的关键因素及答案。不同的问题有不同的框,不能完全在此全部阐述。
数据是越多越好吗?
过去,有一个问题一直令我很困惑,现在的企业获取数据很容易,并且数据的增长速度非常之快,那么对于公司来说,到底要收集什么数据呢?收集多少数据?收集数据的边界在哪里?
后来在美国遇到Patil,他认为过去收集数据很难,而现在获取数据资源变得更容易。但是如果收集数据的出发点,不是为了解决问题,那么收集再多的数据有什么意思呢?
可是许多公司还有一个疑问是,现在收集数据不难,成本也不高,为什么不先收集数据再说呢?等以后需要数据来解决问题时再拿出来用也可以。Patil的答案我也很认同,他劝大家千万别这么想,用这样的理念来设计数据应用肯定会失败的。数据是没有边际的,我为此也痛苦了好一段日子。比如收集一个人的生日,可以精确到几分几秒,但这么精确的数据有什么应用,能产生什么价值呢?
事实上,数据是有生命周期的,比如从中国身份证号码是可以推断出性别的,但是过几年如果这个规则变了,导致我们基于数据所做假设和决策依据也就失去了意义(Data Broken)。更何况保存数据及其收集时的背景(Context)也是一件不容易的事情。所以说,在收集数据的同时,我们必须知道未来可以用来做什么,今天都想不出来的话,日后就更不容易想出来了。
打一个比方,今天很多电商老板会问重复购买率是多少,于是我们收集数据来计算重复购买率,却很少想到需要重复购买率来做什么决定。这就好比刻舟求剑这个故事,他告诉我们世事在变,我们不能只是机械的套用方法或指标。就像重复购买率有不同的定义,而做不同的决策需要不同定义的重复购买率。如果从一家投资公司的角度来看重复购买率,它想收购A公司,那么会从重复购买率来看整个A公司的健康程度或用户质量等。如果从A公司本身运营的角度来看重复购买率,那么它更关注的是日、周级别的重复购买率的变化趋势,或者当月新增客户有多少人在三个月后的重复购买,从而可以衡量每个月新增及存量客户的忠诚度和质量,找出改善的空间。知道了以上的背景之后才去选择用什么数据不是更靠谱吗?
如何用框架来做决定?
对此,我总结了四步走的方法:
第一,首先确定有什么问题,从解决问题的角度出发收集数据;
第二,把收集的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)。让决策者用框更清楚地看到数据与决策之间的关系,比如A公司在框架内要知道竞争情况、新老客户比例情况等因素,以及多种因素互相的关系。
第三,看框架与决策的关系,比如A公司与导航网站有三种选择,完全不合作,部分合作,全面合作。根据数据框架告诉A公司该怎么决策。如果发现数据框架与决策不能匹配,就必须返回到第二步。
第四,根据决策做出行动,检查行动是否达到了目的。如果行动了发现根本没达到目的,就要检讨整个链条,看问题出在哪里。是数据有问题吗?还是因为框架不对?或者是决策不对?是否还有数据没考虑进去?
所以,又回到之前我老说的话题,不懂商业就别谈数据。想要解决的问题越复杂,框架也越复杂。而对于现在多数还没有开始做数据应用的电商公司来说,一开始框架千万不要太复杂,一定是针对某个需解决的问题开始搭框架,令框架与决策之间的关系非常清楚。你的问题是什么,你的decison是什么,反过来你的框架又该怎么样。从小角度切入,从“小”做起。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16