热线电话:13121318867

登录
首页大数据时代学完商业数据分析,开启 CDA 量化策略:从业务思维到落地实战
学完商业数据分析,开启 CDA 量化策略:从业务思维到落地实战
2026-06-11
收藏

解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑

CDA二级认证是企业招聘数据分析师时最常提及的证书门槛。它所对应的《量化策略分析》教材,并不仅仅是一本Python工具书,而是一套完整的“量化策略方法论”。这本书最大的价值在于:它将模糊的业务问题,转化为可量化、可验证、可复用、可管理的分析流程

全书分为原理篇、技术篇、管理篇三大部分,共11章。下面,我将按照知识递进的逻辑,为你彻底拆解这本教材的内在结构。


一、全书整体脉络:三层递进,从“想清楚”到“做出来”再到“管起来”

┌─────────────────────────────────────────────────────────────────────┐
│                     《量化策略分析(2025)》                           │
├───────────────────┬───────────────────┬───────────────────────────┤
│    原理篇         │      技术篇        │        管理篇              │
│  (第1-3章)      │    (第4-9章)      │      (第10-11章)         │
│   “想清楚”       │     “做出来”       │        “管起来”            │
├───────────────────┼───────────────────┼───────────────────────────┤
│ 进阶思维 → 框架   │ 数据处理 → 可视化  │ 企业数据管理方法论          │
│     ↓             │     ↓             │     ↓                     │
│ 量化策略三步法    │ 预处理 → 降维      │ 企业数据安全管理方法论      │
│     ↓             │     ↓             │                           │
│ 七步操作流程      │ 统计检验 → 预测    │ (数据治理数据安全、      │
│                   │     ↓             │  资产入表、成熟度模型)      │
│                   │ 用户分群(聚类)   │                           │
└───────────────────┴───────────────────┴───────────────────────────┘
  • 原理篇:解决“用什么思维和流程来做量化策略”的问题,是脑。
  • 技术篇:解决“用哪些工具和方法来实现”的问题,是手。
  • 管理篇:解决“如何让数据分析工作在企业中规范、安全、可持续”的问题,是骨架。

二、原理篇(第1-3章):从思维到流程,搭建量化策略的“大脑”

原理篇的三章呈现 “道→法→术” 的递进关系。

第1章 进阶数据分析思维(道)

核心脉络:三种思维 → 四阶段应用

本章首先介绍了数字化时代的三种重要思维:

  • 设计思维:从用户/业务需求出发,遵循“同理心→定义问题→构思→原型→测试”的路径。它告诉你:在写任何代码之前,先确保你问对了问题
  • 敏捷思维:强调迭代交付、MVP(最小可行产品),应对数据分析项目的不确定性。
  • 数据思维:区分相关性与因果性,介绍AB测试基础,讨论数据驱动决策的文化建设。

然后,将这三种思维融入现代企业管理的四阶段

  1. 探查阶段:用数据发现业务机会或问题
  2. 定义阶段:将模糊的业务痛点转化为清晰的分析课题
  3. 设计阶段:规划分析路径和解决方案
  4. 交付阶段:输出可落地的策略并推动执行

这一章是全书的方法论基石。后续所有章节都在回答:在不同的阶段,分别用什么技术、按什么步骤去做。


第2章 量化策略分析框架(法)

核心脉络:探索 → 诊断 → 指导

这是整本书最凝练的方法论框架:

  • 探索:发现业务波动或机会点。需要具备业务敏感度,能从日常数据中识别“异常”或“高价值变化”。
  • 诊断:通过数据下钻、对比分析、相关性等手段找到根本原因。考验逻辑推理能力。
  • 指导:基于根因提出可执行的策略建议,并量化预期收益。考验业务转化能力。

本章是第3章“七步法”的纲领。每一个步骤都能映射到“探索、诊断、指导”的某一环节。


第3章 量化策略分析流程(术)

核心脉络:七步法,每一步都有模板和检查清单

1. 发现问题(指标异动/目标差距)
   ↓
2. 近因分析(谁/什么时候/哪里发生变化)
   ↓
3. 根因分析(内部vs外部,多维下钻+相关性+决策树
   ↓
4. 做出预测(简单回归/时间序列)
   ↓
5. 制定方案(策略选项及优先级)
   ↓
6. 验证方案(小范围AB测试或模拟)
   ↓
7. 工具支持(固化到报表或决策系统)

关键知识点

  • 根因分析是本章的核心难点,整合了多维下钻、相关性分析、决策树等多种方法。
  • 预测部分只做概念引入,具体技术实现在第8章。
  • 验证方案为AB测试和模拟验证提供了简易实施步骤。

学完原理篇,你应该能够面对任何业务问题,画出从问题到策略的路线图


三、技术篇(第4-9章):六大工具模块,打造量化策略的“双手”

技术篇遵循数据分析项目的自然工作流,共6章,从数据获取到用户分群,环环相扣。

第4章 数据处理pandas

核心脉络:读取 → 整合 → 清洗

本章是数据分析的“生存技能”。涵盖:

  • 读取与写出数据:CSV、Excel、数据库等
  • 数据整合:行/列操作、条件查询、横向连接(JOIN)、纵向合并(UNION)、排序、分组汇总(GROUP BY)、拆分列、条件赋值
  • 数据清洗重复值处理、缺失值处理

全书示例基于真实零售订单数据,所有操作均有代码演示。

本章处理后的“干净数据”是所有后续分析的基础。


第5章 数据可视化(Matplotlib & Seaborn)

核心脉络:绘图库 → 描述性统计可视化

  • Matplotlib:基础绘图库,掌握画布、坐标轴、图层的概念。
  • Seaborn:高级统计绘图库,一行代码生成复杂图形。
  • 描述性统计与绘图:用直方图箱线图探索数据分布;用散点图热力图发现变量关系;制作报表与统计图形,支撑业务汇报。

可视化不仅是数据探索的工具,也是向业务方传递洞察的桥梁。


第6章 市场调研数据预处理(进阶)

核心脉络数据采集数据预处理特征工程

本章是技术篇中篇幅较大的一章,内容跨度从调研方法到高级编码技术:

数据采集方法

  • 概率抽样(简单随机、分层、系统、整群)
  • 非概率抽样(便利、判断、配额、滚雪球)

市场调研流程目标设定 → 准备 → 实施 → 数据录入

数据预处理基础(核心):

  • 错误数据识别与处理
  • 连续变量离群值识别(IQR法、Z-score法、箱线图法)及处理
  • 分类变量概化处理(合并稀疏类别)
  • 缺失值处理(删除、均值/中位数填充、KNN插补、多重插补)
  • 连续变量分布形态转换(对数、平方根、Box-Cox变换)
  • 连续变量中心标准化或归一化(Z-score、Min-Max)
  • 变量降维(引出第7章)
  • WoE转换:证据权重编码,用于信用评分等场景,将分类变量转换为数值

本章是连接“原始数据”和“建模”的桥梁。经过预处理的数据,才能进入第8章的统计建模


第7章 数据降维方法

核心脉络矩阵分析 → 变量筛选 → PCA因子分析

当变量太多时,需要“浓缩”信息:

  • 矩阵分析:基础回顾(特征值、特征向量)
  • 连续变量降维:分为变量筛选(相关性筛选、方差过滤)和维度规约(PCA
  • 主成分分析(PCA:原理(方差最大化)、步骤(标准化→协方差矩阵→特征值分解→选主成分→投影)、Python实现、结果解释(载荷矩阵、方差解释率)、基于主成分的冗余变量筛选
  • 因子分析(FA):模型介绍、算法、Python实现,以及与PCA的区别(PCA关注总方差,FA关注共同方差

降维后的低维数据可直接用于第8章的回归建模或第9章的聚类分析。


第8章 使用统计学方法进行检验和预测

核心脉络假设检验方差分析 → 卡方检验 → 线性回归逻辑回归

本章是技术篇的核心建模章节,涵盖从基础统计推断到经典预测模型:

假设检验:基本原理、两类错误、与区间估计的联系、基本步骤,以及配对样本t检验(用于比较处理前后差异)。

方差分析(ANOVA)

  • 单因素方差分析:比较多个组间均值差异
  • 多因素方差分析:考虑多个因子及其交互作用

列联表分析与卡方检验:用于检验两个分类变量是否独立。

线性回归

逻辑回归(重点):

本章是CDA二级考试中分值最高的部分。逻辑回归线性回归是数据分析师最常用的预测模型。


第9章 用户分群方法

核心脉络用户细分理念 → 聚类算法 → 聚类评估 → 事后解读

本章专注于监督学习中的聚类分析:

用户细分聚类

  • 用户细分的重要意义(精准营销、差异化运营)
  • 不同商业主题的细分(基于价值、基于行为、基于偏好等)

聚类分析的基本概念:距离度量(欧氏距离、曼哈顿距离等)、簇内凝聚、簇间分离。

聚类模型的评估指标

  • 轮廓系数(Silhouette Coefficient)
  • 平方根标准误差(RMSE)
  • R²(聚类解释的方差比例)
  • ARI(调整兰德指数,用于有真实标签时的评估)

层次聚类

  • 算法描述(自底向上聚合)
  • 分群数量的确定(树状图
  • 应用简单示例
  • 特点(无需预设K值,但计算量大)

K-means 聚类算法

  • 算法描述(迭代更新质心)
  • 应用:用户细分(含完整案例,如电商用户价值分群)

聚类事后分析:决策树应用

本章将“用户分群”这一业务需求转化为可落地的聚类模型,并用决策树提供可解释性,是二级考试中“业务+技术”结合的典型代表。


四、管理篇(第10-11章):让数据分析在企业中“管起来”

管理篇是本书区别于其他技术书籍的独特之处,它回答了:当数据分析能力成为企业核心竞争力时,如何系统性地管理和保护数据资产?

第10章 企业数据管理方法论

核心脉络:概念 → 输入 → 治理流程 → 输出 → 成熟度 → 资产入表

本章完整阐述了企业级数据管理的框架:

基本概念和关键术语:数据管理背景与目标、主要模块(数据治理数据质量、主数据等)及其关系、数据生存周期管理(从创建到销毁)。

输入和资源需求

  • 业务战略(数据管理必须服务业务目标)
  • 组织文化(数据文化的建设)
  • 架构设计和IT系统现状说明(技术基础设施)

数据治理流程(“盘、规、治、用”四字法)

  • :盘清现状,盘点数据资产、数据流向、数据质量问题
  • :制定规范,包括数据标准元数据管理数据质量管理规范
  • :问题整治,解决数据不一致、不完整、不准确等问题
  • :数据应用,推动数据在业务场景中的价值释放

输出和绩效评估

  • 数据管理的输出(数据资产目录、数据质量报告、数据服务API等)
  • 绩效评估(如何衡量数据管理工作的效果)

数据管理的成熟度模型

数据资产价值评估与数据资源入表(本书的亮点):

  • 数据资产价值评估方法(成本法、收益法、市场法)
  • 数据资源入表(财政部《企业数据资源相关会计处理暂行规定》的背景与实践)

这一章对于希望进入数据治理岗位或成为数据团队负责人的读者尤其重要。


第11章 企业数据安全管理方法论

核心脉络:安全需求 → 流程 → 输出 → 成熟度

随着《数据安全法》《个人信息保护法》的实施,数据安全已成为企业红线。本章系统讲解:

数据安全导论

  • 数据安全需求(合规需求、业务连续需求、声誉保护需求)
  • 数据安全定义(保密性、完整性、可用性——CIA三元组)
  • 数据安全管理目标和原则(最小权限、分级分类、全生命周期覆盖等)

输入和资源需求

  • 业务需求(不同业务场景对安全等级的诉求)
  • 监管要求(法律法规、行业标准)

数据生存周期安全管理流程

  • 数据安全需求分析(识别敏感数据、评估风险)
  • 制定数据安全制度和细则(组织架构、岗位职责、操作规程)
  • 数据的分类分级(核心:将数据分为公开、内部、敏感、绝密等层级,为差异化管控提供依据)
  • 数据安全实施控制(访问控制、加密、脱敏、审计、备份恢复等)

输出和绩效评估

  • 数据安全的输出(安全策略文档、分类分级清单、审计日志等)
  • 数据安全的绩效评估(安全事件数量、合规检查通过率等)

数据安全能力成熟度模型(DSMM):国家标准框架,从非正式执行到持续优化的五个等级。

本章是所有从事数据工作的人员必读的“安全必修课”。它告诉你:在发挥数据价值的同时,如何守住合规底线。


五、全书知识脉络总览图

┌─────────────────────────────────────────────────────────────────────────────┐
│                           量化策略分析(2025)完整知识地图                     │
├───────────────────┬─────────────────────────────────┬─────────────────────┤
│      原理篇        │            技术篇                │       管理篇         │
├───────────────────┼─────────────────────────────────┼─────────────────────┤
│ 第1章 三种思维     │ 第4章 pandas数据处理             │ 第10章 数据管理      │
│ 设计·敏捷·数据     │ 读取→整合→清洗                   │ 盘·规·治·用          │
│       ↓           │        ↓                        │ 成熟度·资产入表      │
│ 第2章 三步法       │ 第5章 可视化                     │        ↓            │
│ 探索→诊断→指导     │ Matplotlib+Seaborn              │ 第11章 数据安全管理   │
│       ↓           │        ↓                        │ 分类分级·DSMM       │
│ 第3章 七步法       │ 第6章 预处理                     │                     │
│ 问题→策略验证       │ 抽样·离群·缺失·WoE               │                     │
│                   │        ↓                        │                     │
│                   │ 第7章 降维                       │                     │
│                   │ PCA·因子分析                     │                     │
│                   │        ↓                        │                     │
│                   │ 第8章 统计检验与预测              │                     │
│                   │ t检验·方差·卡方·线性回归·逻辑回归  │                     │
│                   │        ↓                        │                     │
│                   │ 第9章 用户分群                   │                     │
│                   │ K-means·层次聚类·决策树解读       │                     │
└───────────────────┴─────────────────────────────────┴─────────────────────┘

六、学习路径建议

根据你的基础和目标,可以选择不同的学习路径:

学习路径 重点章节 学习目标
快速入门路径(1周) 第1-3章 + 第4-5章 理解量化策略流程,能完成基础数据清洗和可视化
考试核心路径(4-6周) 第8章(回归) + 第9章(聚类) + 第6章(预处理) 覆盖CDA二级考试70%以上考点
数据科学进阶路径 第7章(降维) + 第8.5节(逻辑回归) + 第9章 掌握建模全流程,为三级打基础
管理/治理方向路径 第10章 + 第11章 转向数据治理数据安全、数据资产管理岗位
完整系统学习路径 第1-11章按顺序通读 + 代码复现 成为具备从业务到技术再到管理能力的复合型数据分析师

《量化策略分析》不仅仅是一本考试教材,它是一套将数据转化为商业决策、并能在企业中规范落地的完整方法论。希望这份知识脉络拆解能够帮助你在学习时“既见树木,也见森林”。

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ !

免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

数据分析师资讯
更多

OK
客服在线
立即咨询
客服在线
立即咨询