cda

数字化人才认证

首页 > 行业图谱 >

面试数据分析师的常见问题
2015-12-22
面试数据分析师的常见问题。数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。那么在应聘数据分析师这一职位的求职者会面临哪些面试问题呢? &n ...

两独立样本秩和检验——Mann-Whitney检验

两独立样本秩和检验——Mann-Whitney检验
2020-08-11
文章来源: 丁点帮你 作者:丁点helper  两组独立样本的非参数检验与其t检验相对,主要是用于不满足正态分布的小样本,一般用Wilcoxon秩和检验,又称Mann-Whitney 检验。 这里我们想指出 ...

基于OpenCV的图像卡通化

基于OpenCV的图像卡通化
2020-08-11
文章来源: 小白学视觉 作者:努比 本期将创建一个类似于Adobe Lightroom的Web应用程序,使用OpenCV和Streamlit实现图像的卡通化 作为一个狂热的街头摄影爱好者,几乎每个周末都要在城市中 ...

手把手教你如何使用seaborn绘图--数据集分布可视化

手把手教你如何使用seaborn绘图--数据集分布可视化
2020-08-10
seaborn是一款基于matplotlib的图形可视化python库,它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,它最大 ...

原理+代码|python基于主成分分析的客户信贷评级实战

原理+代码|python基于主成分分析的客户信贷评级实战
2020-08-10
小编今天跟大家分享的文章是关于python基于主成分分析的客户信贷评级实战的,大家在学习python过程中要注意理论学习与实际案例操作相结合,这样才能更好地掌握。好了,跟小编一起来看具体内容吧! 文章来 ...

教你使用3σ原则来进行异常值处理

教你使用3σ原则来进行异常值处理
2020-07-31
在python数据清洗过程中,我们经常会遇到一些偏离正常范围的数据,例如人的体重为56吨,这些数据叫做异常值,如果不做异常值处理,会对我们最终的数据分析造成影响。小编今天给大家带来了一种很实用的异常值处理方 ...

python数据清洗之噪声值的判断和处理

python数据清洗之噪声值的判断和处理
2020-07-31
提到噪声,你会想到什么?刺耳的,高分贝的声音?总之就是不好的,不想接受的声音。小编今天跟大家分享的就是python数据清洗中的噪声数据,对于这些噪声数据我们应该怎样检测和处理呢?下面跟小编一起来看吧。 一 ...

这几种常见的假设检验方法,你了解吗?

这几种常见的假设检验方法,你了解吗?
2020-07-28
假设检验问题是统计推断中的一类重要问题,小编在之前给大家整理,分享过假设检验的基本步骤,今天给大家带来的是常见的假设检验方法,希望对大家有所帮助。 一、假设检验基本概念 假设检验是用来判断样本与 ...

数据分析中R语言缺失值的判断和处理方法有哪些?

数据分析中R语言缺失值的判断和处理方法有哪些?
2020-07-17
R语言是一种用来进行数据分析、绘图的解释型语言。而我们在数据分析过程中会遇到许多缺失值,我们必须对这些缺失值进行处理,才能更好地进行下一步工作。今天小编跟大家分享R语言缺失值的判别和处理方法,希望对大 ...

数据处理中,偏态数据如何正态化?

数据处理中,偏态数据如何正态化?
2020-07-17
在数据处理过程中,经常会遇到偏态数据。我们都知道数据整体服从正态分布,那样本均值和方差则相互独立。因此大家都会希望数据事成正态分布的,但是现实情况却是:大多数情况下,数据都是偏态分布的,这时候就需要 ...

python数据清洗中,是如何识别和处理异常值的?

python数据清洗中,是如何识别和处理异常值的?
2020-07-17
异常值处理是python数据清洗中重要的步骤,虽然异常值出现频率比较低,但是如果置之不理的话,还是会对实际项目的分析造成偏差,所以今天小编就跟大家分享python数据清洗中应该如何识别和处理异常值,希望对大家有 ...

如何清晰的理解Z-Score这种数据标准化的处理方法?

如何清晰的理解Z-Score这种数据标准化的处理方法?
2020-07-10
Z-Score是数据标准化处理的一种常用方法,通过Z-Score,可以将不同量级的数据转化为统一量度的Z-Score分值,并进行比较。 (1)Z-score定义 根据图可以看出,Z-score的数据分布满足“正态分布”(N(0.1)) ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

这3种数据标准化方法,你知道吗?

这3种数据标准化方法,你知道吗?
2020-07-09
数据标准化(normalization)是一个常用的数据预处理操作,就是对原始各项指标数据按比例进行缩放,将数据的单位限制去除,转化为无规模、无量纲的纯数值,减少规模、特征、分布差异等对模型的影响,以便于不同单位 ...
假设检验应该遵循什么样的步骤?它的方法有哪些?
2020-07-07
假设检验是根据一定的假设条件,由样本推断总体的一种方法。 假设检验问题是统计推断中的一类重要问题,在总体的分布函数完全未知或只知其形式,不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总 ...

朴素贝叶斯算法的简单理解和介绍

朴素贝叶斯算法的简单理解和介绍
2020-07-01
贝叶斯分类是一类分类算法的总称,这类算法都是以贝叶斯定理为基础,所以统称为贝叶斯分类。贝叶斯分类中最简单,同时也是常见的一种分类方法就是朴素贝叶斯分类。下面小编来简单介绍一下朴素贝叶斯分类。 一、 ...

对于T分布来源和定义的简单理解

对于T分布来源和定义的简单理解
2020-07-01
相信各位统计学的小伙伴对于T分布并不陌生,T分布,即学生T-分布(Student\'s t-distribution),经常被应用在对呈正态分布的总体的均值进行估计。下面小编就具体来介绍一下T分布。 一、T分布的来源 简单 ...

偏态数据:何为数据的偏态分布?

偏态数据:何为数据的偏态分布?
2020-06-29
相信大家在一定有接触过偏态分布这一概念,在统计学偏态分布,是指统计数据峰值与平均值不相等的频率分布。根据峰值小于或大于平均值可分为正偏函数和负偏函数,其偏离的程度可用偏态系数刻画。在数据预处理过程中 ...

什么是卡方分布,有什么特征?

什么是卡方分布,有什么特征?
2020-06-24
一、卡方分布定义 卡方分布 (χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。 若k 个随机变量Z1、 ...
python知识普及:numpy基础操作
2020-06-10
Numpy基础数据结构 import numpy as np ar = np.array([[1,2,3], [3,4,6], [4,5,7]])  # 二维数组 print(ar) print(type(ar)) ar [[1 2 3] [3 4 6] [4 5 7]] array([[1, 2, 3],       ...

OK
客服在线
立即咨询