cda

数字化人才认证

首页 > 行业图谱 >

竞赛中常见的特征工程技巧有哪些?
2023-08-15
特征工程是机器学习和数据挖掘领域中的关键步骤之一。它涉及对原始数据进行转换、选择和创建特征,以使其更适合用于机器学习算法的训练和预测。在竞赛中,精心设计的特征工程技巧可以显著提高模型的性能。以下是常见 ...
如何对数据进行特征工程
2023-06-15
特征工程是机器学习中至关重要的一步,它是将原始数据转换为机器学习算法可以使用的特征向量的过程。在本文中,我们将探讨如何对数据进行特征工程。 数据清洗 在进行特征工程之前,首先需要对原始数据进行清洗。这 ...
特征工程是什么?常用的方法有哪些?
2020-07-07
“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器 ...

一文带你读懂 特征工程

一文带你读懂特征工程
2020-04-20
无论它的规模和大小如何,数据已经成为现代企业、公司和组织的一流资产。任何一个智能系统都需要数据驱动,无论它多复杂。每个智能系统的核心,均有一个或多个基于某种数据学习方法的算法,例如机器学习、深 ...

【CDA干货】数据标准化后出现负值?别急!场景化解决全方案

【CDA干货】数据标准化后出现负值?别急!场景化解决全方案
2025-12-02
在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一尺度,为模型训练或业务分析扫清障碍。但很多数据从业者会陷入“负值恐慌”:Z-score ...

【CDA干货】数据驱动增长:三大行业A/B测试落地案例与数据分析实战

【CDA干货】数据驱动增长:三大行业A/B测试落地案例与数据分析实战
2025-12-01
在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实验环境”,用严谨的数据分析剥离偶然因素,让每一个业务决策都有数据支撑。然而,多数 ...

【CDA干货】业务模型与数据模型:数字化时代的“双轮”差异与协同

【CDA干货】业务模型与数据模型:数字化时代的“双轮”差异与协同
2025-11-20
在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如何通过活动提升转化”,数据团队口中的“用户增长模型”则聚焦“如何用算法预测转化概 ...

【CDA干货】游戏流失预测:解码用户行为序列中的流失信号

【CDA干货】游戏流失预测:解码用户行为序列中的流失信号
2025-11-20
在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从“高频登录”到“间隔变长”,从“付费活跃”到“零消费”,每一步变化都藏在用户行为 ...

【CDA干货】序列模式挖掘在电商零售中的应用

【CDA干货】序列模式挖掘在电商零售中的应用
2025-11-17
核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序列下的行为与结果关联”,通过量化“浏览行为”对“下单概率”的提升幅度,挖掘用户行 ...

【CDA干货】机器学习分类模型:从原理到实战的完整指南

【CDA干货】机器学习分类模型:从原理到实战的完整指南
2025-11-06
在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 / 恶性)”,从 “客户流失预测(流失 / 留存)” 到 “图像分类(猫 / 狗 / 汽车)” ...

CDA 数据分析师:决策树分析实战指南 —— 可解释性建模与业务规则提取核心工具

CDA 数据分析师:决策树分析实战指南 —— 可解释性建模与业务规则提取核心工具
2025-11-06
在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户是否流失并明确流失原因”“判断客户是否办理贷款并提炼审批规则”。这类问题需要模型 ...

【CDA干货】CDA 数据分析实战:三大行业真实案例的价值落地之路

【CDA干货】CDA 数据分析实战:三大行业真实案例的价值落地之路
2025-11-05
CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵”,唯有扎根行业痛点,用专业方法破解实际问题,才能彰显数据的真正力量。本文结合零售 ...

【CDA干货】数据挖掘核心步骤与实战:以零售企业客户流失预测为例

【CDA干货】数据挖掘核心步骤与实战:以零售企业客户流失预测为例
2025-11-04
在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升收入、优化体验” 的隐性规律。但数据挖掘并非 “拿到数据就建模” 的无序过程,需遵循 ...

CDA 数据分析师:因子分析实战指南 —— 高维数据的潜在维度挖掘与业务价值提炼

CDA 数据分析师:因子分析实战指南 —— 高维数据的潜在维度挖掘与业务价值提炼
2025-11-03
在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次数、评论数、复购频次、消费金额” 等 10 + 特征,表面上分散独立,实则可能由 “消费 ...

【CDA干货】特征单变量筛选:从原理到实战,高效精简特征的核心方法

【CDA干货】特征单变量筛选:从原理到实战,高效精简特征的核心方法
2025-10-21
在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特征(如 “用户 ID”“无效时间戳”),既能降低后续建模的计算成本(如减少 50% 特征可 ...

CDA 数据分析师:以量化策略分析框架为刃,破解企业决策的 “数据密码”

CDA 数据分析师:以量化策略分析框架为刃,破解企业决策的 “数据密码”
2025-10-17
在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍板” 做促销可能导致成本失控,零售靠 “店长经验” 备货可能造成库存积压。而量化策 ...

【CDA干货】鸢尾花识别案例:一文读懂特征值与目标值的核心定义与应用

【CDA干货】鸢尾花识别案例:一文读懂特征值与目标值的核心定义与应用
2025-10-15
在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适中,包含了植物学中可量化的形态特征,以及明确的品种分类目标,几乎所有初学者的第一 ...

数据分析师必备技能体系:从工具到思维,构建数据驱动的核心竞争力

数据分析师必备技能体系:从工具到思维,构建数据驱动的核心竞争力
2025-10-14
在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分析结果转化为业务决策。但成为一名合格的数据分析师,绝非 “会用 Excel 做表”“会写 ...

【CDA干货】机器学习特征重要性分析:原理、实战与业务落地指南

【CDA干货】机器学习特征重要性分析:原理、实战与业务落地指南
2025-10-11
在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模型效率,更能揭示 “哪些因素真正影响目标结果”(如用户流失的核心原因、房价波动的关 ...

CDA 数据分析师:精通标签加工方式,让数据标签从 “raw” 到 “ready”

CDA 数据分析师:精通标签加工方式,让数据标签从 “raw” 到 “ready”
2025-09-29
在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加工—— 即将分散的原始数据(如用户行为日志、订单记录)通过清洗、计算、建模等手段, ...

OK
客服在线
立即咨询