京公网安备 11010802034615号
经营许可证编号:京B2-20210330
表象层,就像汽车仪表盘,实时告诉你发生了什么,并适时做个警报提示等等,是what。分析师要做的事情就是搭建指标体系,进行各种维度的统计分析。
本质层,像诊断仪,不再停留在观察肉眼可见的表面症状,而是去检测身体内部的问题,这个层面要揭露现象背后的动因,找到规律,是why。主要做的事情就是进行个案分析获得需求动机层面的认知,然后对个体进行聚类获得全面的洞察。
抽象层,是特殊到一般的过程,对业务问题进行抽象,用模型去刻画业务问题,是how。这个层面做的事情就是把问题映射到模型,然后再用模型去做预测,减少不确定性。其产出主要是分类(标签)和排序(评分)。
现实层,是一般到特殊的过程,将抽象的模型套用到现实中来,告诉大家如何去行动,是when、where、who and whom。就像航标,要时刻为业务保驾护航,指导业务的行动。其产出主要是规则和短名单。
在明确数据分析的层次后,要想从洞察到行动,需要做到四个层次的穿透和每个层次的深入。首先,分析要能够穿透各个层次,只有上下贯通,数据分析的价值才能立竿见影。其次,在分析的每个层次上要做的深入。
一、在表象层,看数据要深入。主要体现在两个方面:
1. 从“点“到”线面体“,从看一个点的数据,到看线,看面,看体。
一般来讲,想看数据的人潜意识里是要成“体”的数据的,只是沟通过程中变成了“点”的需求,因为“点”简单容易讲明白,但是,这次给不了“体”的数据,下次还会围绕“体”的数据提各种“点”的需求,这个时候我们需要延伸一下,提前想需求方之所想,就不用来回往复了。
2. 关注数据之间的逻辑关系
这方面最值得借鉴的就是平衡计分卡了,平衡计分卡从数据指标的角度去看,就是一套带有因果关系的指标体系。
平衡计分卡通过Strategy Map把策略说清楚讲明白,通过KPI进行有效的衡量,被评价为“透视营运因果关系的绩效驱动器”(政大会计系教授 吴安妮),“将策略化为具体行动的翻译机”(台大会计系教授 杜荣瑞)。
平衡计分卡对我们的启发是,人人可以梳理出一套和自己业务相关的有逻辑关系的数据指标体系,通过它实现聚焦和协同。
二、在本质层,深入理解业务模式,并跳出既有的思维模式,建立新的心智模型。
比如我们看淘宝,淘宝业务的本质是什么呢?其中一个答案是复杂系统。
大家都知道,淘宝是一个生态系统,淘宝是一个典型的由买家、卖家、ISV、淘女郎等各种物种构成的复杂系统,阿里巴巴是一个更大的复杂系统。
复杂系统对我们的启发是,关注个体(系统内部买家卖家等参与者)的同时,注意分析个体在群体中位置和角色,分析群体的发展潜力、演化规律、竞争度、成熟度等,分析群体和群体之间关系。同时,对应的抽象层建模的方法也要与之适配。
三、在抽象层,微观上构建更加抽象的特征,宏观上构建更加抽象的模型。
1. 在既有的分析和挖掘框架下,构建更加抽象的特征(也可以理解成维度、指标)。
这个可以类比现在最火的Deep Learning技术,如果对一个图片进行识别,即使你获取的是像素信息,深度学习可以自动学习出像素背后的形状、物体的特征等中间知识,越上层的特征越接近真相。
1、对我们的启示就是,在交易笔数交易金额这种“像素级别”特征(指标)的基础上,可以考虑是否交易笔数连续上升、营销活动交易占比等带有业务含义,更加抽象同时接近业务的特征(指标)。用抽象的特征去建模可以提升模型的效果,用抽象的指标去分析可以更贴近业务需求。
2.宏观方面,可以用更加抽象的方式对业务进行建模
在前面提到淘宝是复杂系统,我们也可以对复杂系统进行建模。做些适当的简化,对淘宝做一个高度抽象,那就是一个字“网”。节点是买家、卖家等物种,边就是购买、收藏、喜欢等行为产生的关系。整个淘宝就是一张大网。
图注: 不同的颜色表示不同的细分互动市场,点代表的是店铺或者会员,连线表示会员是店铺的熟客,点的大小对店铺而言代表店铺的熟客数,对会员而言代表常购买的店铺数,越接近图的中心越表示大众化的需求,越接近图的边缘越体现需求的个性化。
建立这张大网之后,我们就可以做深入的分析,比如市场细分,个性化推荐等等。
四、在现实层,要深入到业务中去,不断提升对相关业务的认知能力。
心态上不要自我设限,分析无边界,分析师要主动参与到业务模式、产品形态的规划和设计去。要了解业务,在此基础上灵活运用模型的产出,比如:一个风险控制策 略,假如已经有一个风险事件打分模型对风险事件打分排序,分析师可以根据业务需求灵活设计模型的使用策略,例如,对于风险得分最高的时间,机器自动隔离, 风险得分偏高的,用机器+人工审核的半自动方式进行隔离。模型是死的,活用靠人。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16