cda

数字化人才认证

首页 > 行业图谱 >

如何处理数据分析中的异常值
2023-07-03
标题:异常值在数据分析中的处理方法 引言: 在进行数据分析时,我们经常会遇到异常值(Outliers)。异常值是指与其他观测值相比明显偏离的数据点,它们可能由于错误、噪音或罕见事件等原因而出现。如果不正确处理异 ...
如何处理缺失数据以及异常值
2023-07-03
标题:缺失数据与异常值处理:方法与策略 导言: 在数据分析和统计建模过程中,我们经常面临着缺失数据和异常值的问题。缺失数据可能由于多种原因引起,如记录错误、技术故障或者调查对象不愿提供某些信息。而异常值 ...
如何应对数据缺失和异常值
2023-06-20
数据缺失和异常值是数据科学中常见的问题,可能会对数据分析和模型建立造成影响。在本篇文章中,我将探讨如何识别、处理和应对这些问题。 首先,我们来了解什么是数据缺失和异常值。数据缺失是指在数据集中存在一些 ...
如何处理缺失数据和异常值
2023-06-20
缺失数据和异常值是数据处理过程中经常遇到的问题,在数据分析和建模中,这些问题可能会导致结果不准确或者偏差较大。因此,有效地处理缺失数据和异常值是至关重要的。 一、处理缺失数据 缺失数据是指在某个变量中存 ...
如何处理缺失值或异常值
2023-06-15
缺失值与异常值是数据分析中常见的问题,它们可以影响模型的准确性和可靠性。因此,在进行数据分析之前需要对这些值进行处理。本文将介绍如何处理缺失值和异常值的方法。 一、缺失值的处理 缺失值是指数据集中某些记 ...

如何处理缺失值和 异常值 ?

如何处理缺失值和异常值
2023-06-15
缺失值和异常值是数据处理中常见的问题,因为它们会对分析结果产生负面影响。在本文中,我们将讨论如何处理这些问题。 一、缺失值的处理 缺失值是指数据集中的某些值缺失或未记录,造成了在特定属性上的数据 ...
如何识别和删除异常值
2023-06-15
异常值(Outliers)是指在数据集中出现的与其他数据点明显不同的观测值,可能会对分析结果产生显著影响。因此,正确识别和删除异常值是数据分析的重要步骤之一。本文将介绍如何识别和删除异常值。 一、如何识别异常 ...
R语言如何批量剔除异常值
2023-04-07
R语言是一种强大的数据分析工具,其提供了丰富的函数和工具帮助我们处理数据。异常值通常会对分析结果产生不良影响,因此对于数据清洗的过程中,剔除异常值是必不可少的步骤之一。在这篇文章中,我将介绍如何使用R语 ...

R语言: 异常值 检验、离群点分析、 异常值 处理

R语言:异常值检验、离群点分析、异常值处理
2017-07-17
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理方 ...

R语言-如何处理回归中的 异常值 点

R语言-如何处理回归中的异常值
2017-05-30
R语言-如何处理回归中的异常值点 异常观测值 一个全面的回归分析要覆盖对异常值的分析,包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究,因为它们在一定程度上与其他观测点不同,可能对结 ...
sas信用评分之不用检查异常值的最优分组
2017-05-29
sas信用评分之不用检查异常值的最优分组 今天的更新比以往晚了一天,假期综合症第一天,我到现在已经喝了第三杯咖啡,实现上周的预告,这种更新一个不用检查异常值的数值变量最优分组。其实这代码我本来不想拿 ...

教你使用3σ原则来进行 异常值 处理

教你使用3σ原则来进行异常值处理
2020-07-31
在python数据清洗过程中,我们经常会遇到一些偏离正常范围的数据,例如人的体重为56吨,这些数据叫做异常值,如果不做异常值处理,会对我们最终的数据分析造成影响。小编今天给大家带来了一种很实用的异常值处理方 ...

【CDA干货】数据清洗全流程常见问题解析:规避陷阱,筑牢数据价值根基

【CDA干货】数据清洗全流程常见问题解析:规避陷阱,筑牢数据价值根基
2026-04-22
数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用”的关键一步。所谓数据清洗,并非简单的“删除错误数据”,而是一套系统性的流程——涵 ...

【CDA干货】数据波动性评估:从量化分析到风险防控的实践指南

【CDA干货】数据波动性评估:从量化分析到风险防控的实践指南
2026-04-21
在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、用户活跃度的周期性变化、实验数据的随机波动,这些波动背后既隐藏着业务规律,也可能 ...

【CDA干货】多变量一般线性分析结果解读:从数据关联到决策支撑的完整指南

【CDA干货】多变量一般线性分析结果解读:从数据关联到决策支撑的完整指南
2026-04-21
在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analysis,简称多变量GLM)成为最核心的统计工具之一。它不仅是单变量线性分析的延伸,更是 ...

【CDA干货】特征重要性分析:解锁机器学习模型价值的核心钥匙

【CDA干货】特征重要性分析:解锁机器学习模型价值的核心钥匙
2026-04-20
在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮我们筛选冗余特征、优化模型结构,更能破解模型“黑箱”困境,揭示数据与目标变量之间 ...

从“杂乱”到“有序”:CDA数据分析师视角下的数据的描述性统计

从“杂乱”到“有序”:CDA数据分析师视角下的数据的描述性统计
2026-04-20
很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题,用描述性统计就能解决。 引言:为什么描述性统计是数据分析的“基本功”? 小张是一名 ...

【CDA干货】数据分析与数据挖掘:必备工具与核心技能全解析

【CDA干货】数据分析与数据挖掘:必备工具与核心技能全解析
2026-04-17
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗、零售等各个领域。数据分析聚焦“解读数据、发现规律”,回答“是什么、为什么”;数 ...

【CDA干货】最大最小距离法在Kmeans聚类中的应用困境与优化路径

【CDA干货】最大最小距离法在Kmeans聚类中的应用困境与优化路径
2026-04-16
在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用户画像、异常检测、数据降维等实际场景。聚类效果的优劣,核心取决于初始聚类中心的选 ...

【CDA干货】随机森林特征重要性分析:原理、方法与实操指南

【CDA干货】随机森林特征重要性分析:原理、方法与实操指南
2026-04-16
在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延长训练时间,还可能引发过拟合,降低模型泛化能力,甚至掩盖关键特征的真实影响。随机 ...

OK
客服在线
立即咨询