cda

数字化人才认证

首页 > 行业图谱 >

缺失 数据处理 -插值法

缺失数据处理-插值法
2017-12-04
缺失数据处理-插值法 在数据挖掘中,原始海量的数据中存在着大量不完整、不一致、有异常、偏离点的数据。这些问题数据轻则影响数据挖掘执行效率,重则影响执行结果。因此数据预处理工作必不可少,而其中常见工 ...

 数据处理 流程和数据分析方法

数据处理流程和数据分析方法
2017-11-21
数据处理流程和数据分析方法 大数据分析这件事用一种非技术的角度来看的话,就可以分成金字塔,自底向上的是三个部分,第一个部分是数据采集,第二个部分是数据建模,第三个部分是数据分析,我们来分别看一下。 ...
运用大数据处理技术 做好国有企业思想政治工作
2017-11-14
运用大数据处理技术 做好国有企业思想政治工作 在全面深化企业改革和互联网全面普及的新形势下,国有企业思想政治工作面临着许多新情况,国有企业要勇于挑战自我、求新达变,积极推进思想政治工作理念创新、手 ...
SPSS-数据处理-数据变量
2017-10-23
SPSS-数据处理-数据变量 spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。 接下来主要介绍两点有关变量的基础知识 ...

R语言︱噪声 数据处理 、数据分组—分箱法(离散化、等级化)

R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化)
2017-07-17
R语言︱噪声数据处理、数据分组—分箱法(离散化、等级化) 分箱法在实际案例操作过程中较为常见,能够将一些数据离散化,等级化,比如年龄段,我们并不想知道确切的几岁,于是乎可以将其分组、分段。 基础 ...
R语言时间数据处理之lubridate包
2017-05-08
R语言时间数据处理之lubridate包 在我们处理一些时间序列数据时,经常会碰到各种时间数据,比如“2016-03-03”。很多时候我们需要提取出其中的年、月、日甚至是小时、分、秒,从而可以方便的进行比较、筛选等操 ...

一个使用R语言做 数据处理 的实例

一个使用R语言做数据处理的实例
2017-04-21
一个使用R语言做数据处理的实例 最近一个同学找到我,希望我帮忙处理一份数据。那份数据是这样的:包含了3661行,第一行为各列的名称;包含8列,第一列为专利ID,其余7列为企业ID。 这份数据截图如下所示: ...

 数据处理 中,偏态数据如何正态化?

数据处理中,偏态数据如何正态化?
2020-07-17
在数据处理过程中,经常会遇到偏态数据。我们都知道数据整体服从正态分布,那样本均值和方差则相互独立。因此大家都会希望数据事成正态分布的,但是现实情况却是:大多数情况下,数据都是偏态分布的,这时候就需要 ...

从“杂乱信号”到“有序资产”:CDA数据分析师视角下的数据分类

从“杂乱信号”到“有序资产”:CDA数据分析师视角下的数据分类
2026-06-04
 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量?各适合使用哪种统计分析方法”时,却常常语塞。其实,数据分类是数据分析的“第一道 ...

【CDA干货】基于Python Tkinter的界面美化技术与实操应用

【CDA干货】基于Python Tkinter的界面美化技术与实操应用
2026-05-29
Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程序、工具软件、可视化系统的首选框架。原生Tkinter控件样式老旧、界面单调、色彩单一 ...

从“raw”到“ready”:CDA数据分析师视角下的标签加工方式

从“raw”到“ready”:CDA数据分析师视角下的标签加工方式
2026-05-29
 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当导致标签失效,或因规则模糊造成标签口径混乱。其实,好的标签并非设计出来,而是加工 ...

【CDA干货】数据挖掘经典实例分析:从技术原理到行业落地应用

【CDA干货】数据挖掘经典实例分析:从技术原理到行业落地应用
2026-05-28
随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表面结果,无法挖掘数据背后隐藏的关联规律、潜在风险与未来趋势。而数据挖掘正是依托统 ...

从“构建数据骨架”到“加速智能取数”:CDA数据分析师视角下的创建表或视图

从“构建数据骨架”到“加速智能取数”:CDA数据分析师视角下的创建表或视图
2026-05-26
 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有什么区别,分别应该在什么业务场景下使用”时,却常常陷入支支吾吾的困境。其实,CURD ...

【CDA干货】基于3σ原则的异常数据识别与质量控制方法研究

【CDA干货】基于3σ原则的异常数据识别与质量控制方法研究
2026-05-25
在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基础。数据集中存在的极端异常值,会严重扭曲均值、标准差等统计指标,破坏数据分布规律 ...

【CDA干货】SQL在企业经营数据分析中的深度应用:赋能精细化经营与科学决策

【CDA干货】SQL在企业经营数据分析中的深度应用:赋能精细化经营与科学决策
2026-05-22
数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为,都会以数据形式沉淀在数据库中。而SQL作为通用型结构化查询语言,是连接企业原始数 ...

【CDA干货】数据清洗中异常值识别与处理:三大核心方法详解

【CDA干货】数据清洗中异常值识别与处理:三大核心方法详解
2026-05-20
在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误导决策方向。所谓异常值,是指数据集中偏离整体分布、与其他数据点显著不同的观测值, ...

【CDA干货】Excel卡方检验实操指南:从数据整理到结果解读,新手也能轻松上手

【CDA干货】Excel卡方检验实操指南:从数据整理到结果解读,新手也能轻松上手
2026-05-18
在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场调研、医学统计、社会科学、企业运营等多个领域。例如,分析不同性别对产品偏好的差异 ...

【CDA干货】事实表与维度表的核心区别:数据仓库的两大核心组件解析

【CDA干货】事实表与维度表的核心区别:数据仓库的两大核心组件解析
2026-05-15
在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什么”,记录业务过程中的具体数据;维度表聚焦“是谁、何时、何地、如何发生”,描述业 ...

【CDA干货】Pandas基于两列计算结果:实操指南与实战案例

【CDA干货】Pandas基于两列计算结果:实操指南与实战案例
2026-05-14
在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多列)数据进行计算,是日常数据处理中最高频的操作之一——无论是简单的加减乘除、比例 ...

【CDA干货】大数据营销案例深度解析:以数据为刃,破局营销粗放时代

【CDA干货】大数据营销案例深度解析:以数据为刃,破局营销粗放时代
2026-05-13
当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全新的破局路径——它不再是单纯的“数据堆砌”,而是通过整合海量、多维度、实时的用户 ...

OK
客服在线
立即咨询