cda

数字化人才认证

首页 > 行业图谱 >

【CDA干货】特征相对重要性:解锁模型鲁棒性与可解释性的双重密钥

【CDA干货】特征相对重要性:解锁模型鲁棒性与可解释性的双重密钥
2025-12-05
在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据,将难以通过合规审查;电商推荐模型若对异常点击数据敏感,会导致推荐效果剧烈波动。而 ...
CDA二级备考经验
2025-12-04
作者简介:姜天翼 数据分析从业者 我是一名统计学专业出身的数据分析师,在经过了3年的数据分析工作与踩坑后,我对数据分析这个职业和工作内容有了更深的理解,本次借着报考CDA二级的备考分享聊聊对数据分析师的一些 ...

【CDA干货】大数据存储技术全景解析:从架构到选型的完整指南

【CDA干货】大数据存储技术全景解析:从架构到选型的完整指南
2025-12-03
随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些数据体量巨大、类型复杂、增长迅速,对存储技术提出了“高容量、高吞吐、高可用、可扩 ...

【CDA干货】数据标准化后出现负值?别急!场景化解决全方案

【CDA干货】数据标准化后出现负值?别急!场景化解决全方案
2025-12-02
在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一尺度,为模型训练或业务分析扫清障碍。但很多数据从业者会陷入“负值恐慌”:Z-score ...

【CDA干货】MySQL查询阻塞在query end状态:排查与解决全指南

【CDA干货】MySQL查询阻塞在query end状态:排查与解决全指南
2025-11-28
在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态更新等工作。但当查询长期阻塞在该状态时,会占用数据库连接与系统资源,导致后续请求 ...

【CDA干货】SQL实时表实现解析:从技术原理到落地实践

【CDA干货】SQL实时表实现解析:从技术原理到落地实践
2025-11-13
在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实时监控交易风险时,传统“T+1”离线表已无法满足需求,SQL实时表应运而生。SQL实时表 ...

CDA 数据分析师:因子分析实战指南 —— 高维数据的潜在维度挖掘与业务价值提炼

CDA 数据分析师:因子分析实战指南 —— 高维数据的潜在维度挖掘与业务价值提炼
2025-11-03
在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次数、评论数、复购频次、消费金额” 等 10 + 特征,表面上分散独立,实则可能由 “消费 ...

CDA 数据分析师:逻辑回归实战指南 —— 二分类预测与业务决策的核心工具

CDA 数据分析师:逻辑回归实战指南 —— 二分类预测与业务决策的核心工具
2025-10-31
在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户是否会购买产品”“识别交易是否为欺诈”。这类问题无法用预测数值的线性回归解决,而 ...

【CDA干货】左尾数据的正态化处理:从识别到落地的完整指南

【CDA干货】左尾数据的正态化处理:从识别到落地的完整指南
2025-10-28
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的有效性、模型的预测精度才能得到保障。但实际业务中,大量数据呈现 “左偏分布”(左 ...

【CDA干货】卷积层之后:归一化与激活函数的取舍之道

【CDA干货】卷积层之后:归一化与激活函数的取舍之道
2025-10-24
在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都会面临的基础决策。这三者的组合并非随意搭配,而是深刻影响模型训练稳定性、收敛速度 ...

【CDA干货】神经网络与卡尔曼滤波的融合:突破传统局限的智能状态估计技术

【CDA干货】神经网络与卡尔曼滤波的融合:突破传统局限的智能状态估计技术
2025-10-23
在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真实状态(如无人机的位置与速度、化工反应釜的温度与压力、汽车的行驶轨迹)。卡尔曼滤 ...

【CDA干货】神经网络越大越好吗?—— 规模选择的辩证思考与实践边界

【CDA干货】神经网络越大越好吗?—— 规模选择的辩证思考与实践边界
2025-10-22
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4,神经网络的规模似乎正朝着 “越大越好” 的方向演进。但事实果真如此吗?神经网络的 ...

【CDA干货】偏态分布的置信区间:从原理到实战,破解非对称数据的统计推断难题

【CDA干货】偏态分布的置信区间:从原理到实战,破解非对称数据的统计推断难题
2025-10-20
在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集中在几百元)、居民收入水平(高收入群体拉高均值,分布右偏)、产品故障间隔时间(多 ...

【CDA干货】深度学习的核心引擎:损失函数与反向传播的协同原理与实战

【CDA干货】深度学习的核心引擎:损失函数与反向传播的协同原理与实战
2025-10-09
在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 “量化错误”(计算预测值与真实值的差距),反向传播负责 “定位错误来源”(沿着神 ...

【CDA干货】正态 t 检验与符号秩检验的选择指南

【CDA干货】正态 t 检验与符号秩检验的选择指南
2025-10-09
本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确:何时必须用 t 检验,何时只能用符号秩检验,以及如何通过数据特征快速决策。 一、先 ...

【CDA干货】球面卷积神经网络(SCNN)

【CDA干货】球面卷积神经网络(SCNN)
2025-09-30
球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通过重构 “卷积核设计、数据采样、特征聚合” 的底层逻辑,让神经网络能够适配球面的非 ...

【CDA干货】MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略

【CDA干货】MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略
2025-09-24
MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— 部分服务器初始内存占用仅 2GB,运行数月后却飙升至 8GB 以上,且无明显大查询或高并发 ...

【CDA干货】解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南

【CDA干货】解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南
2025-09-15
解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests库),开发者常会接触到响应对象(Response)的两个核心属性 ——text和content。二者 ...

【CDA干货】机器学习解决实际问题的核心关键:从业务到落地的全流程解析

【CDA干货】机器学习解决实际问题的核心关键:从业务到落地的全流程解析
2025-09-09
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于推荐系统、金融风控、工业质检、医疗诊断等领域。然而,并非所有机器学习项目都能实现 ...

【CDA干货】密集连接卷积神经网络(DenseNet):最后归一化的技术价值与实践

【CDA干货】密集连接卷积神经网络(DenseNet):最后归一化的技术价值与实践
2025-09-04
在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连接卷积神经网络(DenseNet),通过 “密集块(Dense Block)” 中相邻层的全连接设计 ...

OK
客服在线
立即咨询