首页 > 行业图谱 >

- CDA LEVEL I 数据分析认证考试模拟题库(三)
2020-12-10
-
今天,我们继续给大家出关于CDA LEVEL I 数据分析认证考试模拟题库中的5题,同样的,在出题前公布上一期的正确答案。
6、D
7、D
8、C
9、A
10、A
你都答对了吗?接下来,我们一起来做11-15 ...

- 异常检测原理与实验
2018-08-19
-
异常检测原理与实验
最近需要对欺诈报价进行识别处理,简单的模型就是给定很多不同数据集,需要找出每个spu下可能存在的欺诈数据,比如{20,22,30},其中的欺诈数据可能就是30。其实加以抽象,属于异常检测范围。 ...

- 一种面向高维数据的集成聚类算法
2018-06-10
-
一种面向高维数据的集成聚类算法
聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,得到一个能较好地反映数据集内在结构的数据划分。很多学者的研究证明聚类集成能有效 ...

- 对数据科学家来说最重要的算法和统计模型
2018-05-31
-
对数据科学家来说最重要的算法和统计模型
作为一个在这个行业已经好几年的数据科学家,在LinkedIn和QuoLa上,我经常接触一些学生或者想转行的人,帮助他们进行机器学习的职业建议或指导方面相关的课程选择。一 ...
- SPSS聚类分析:系统聚类分析
2017-12-18
-
SPSS聚类分析:系统聚类分析
一、概念:(分析-分类-系统聚类)
系统聚类法常称为层次聚类法、分层聚类法,也是聚类分析中使用广泛的一种方法。它有两种类型,一是对研究对象本身进
行分类,称为Q ...
- 大数据十大经典算法之k-means
2017-11-13
-
大数据十大经典算法之k-means
k均值算法基本思想:
K均值算法是基于质心的技术。它以K为输入参数,把n个对象集合分为k个簇,使得簇内的相似度高,簇间的相似度低。
处理流程:
1、为每个聚类确定一个 ...

- 学会数据分析背后的挖掘思维,分析就完成了一半
2017-08-09
-
学会数据分析背后的挖掘思维,分析就完成了一半
在数据分析中,模型是非常有用和有效的工具和数据分析应用的场景,在建立模型的过程中,数据挖掘很多时候能够起到非常显著的作用。伴随着计算机科学的发展,模型也越 ...
- R语言多元分析系列
2017-07-21
-
R语言多元分析系列
R语言多元分析系列之一:主成分分析
主成分分析(principal components analysis,
PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...

- 数据分析实例--R语言如何对垃圾邮件进行分类
2017-07-07
-
数据分析实例--R语言如何对垃圾邮件进行分类
Structure of a Data Analysis
1 数据分析的步骤
l Define the question
l Define the ideal data set
l Determine what data ...

- 好课推荐丨CDA建模分析师-R语言
2017-05-05
-
数据科学家被认为是21世纪最性感也是最具发展前景的职业,目前有75%左右的数据科学家使用R语言,有35%左右的数据科学家将R语言作为首选统计分析工具。今天,我们来了解一下R语言的前世今生。
一、R的 ...

- 数据挖掘的常用方法、功能和一个聚类分析应用案例
2017-05-04
-
数据挖掘的常用方法、功能和一个聚类分析应用案例
一、数据挖掘的常用方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不 ...

- 数据挖掘:手把手教你做文本挖掘
2017-05-03
-
数据挖掘:手把手教你做文本挖掘
1文本挖掘定义
文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算 ...

- 机器理解大数据的秘密:聚类算法深度详解
2017-04-03
-
机器理解大数据的秘密:聚类算法深度详解
在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍, ...

- 数据挖掘方法功能和聚类分析案例
2017-03-01
-
数据挖掘方法功能和聚类分析案例
一、数据挖掘的常用方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行 ...

- R语言的三种聚类方法
2017-02-24
-
R语言的三种聚类方法
一、层次聚类
1)距离和相似系数
r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离 ...

- 聚类分析案例之市场细分
2017-02-24
-
聚类分析案例之市场细分
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。
聚 ...

- 数据挖掘与数据分析梳理
2016-10-11
-
数据挖掘与数据分析梳理
一、数据挖掘和数据分析概述
数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。
数据挖掘和数据分析的不同之处: ...

- 聚类分析实战解析与总结
2016-10-10
-
聚类分析实战解析与总结
聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组 ...
- 数据缺失值的4种处理方法
2016-09-27
-
数据缺失值的4种处理方法
一、缺失值产生的原因
缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器 ...
- 案例详解SPSS聚类分析全过程
2016-09-13
-
案例详解SPSS聚类分析全过程
案例数据源:
有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。
【一】问题一:选择那些变量进行聚类?——采用“R型聚类” ...