首页 > 行业图谱 >

- 手中无y,心中有y——聚类算法的正确建模方式
2021-12-10
-
CDA数据分析师 出品
作者:CDA教研组
编辑:JYD
聚类算法是属于无监督的机器学习方法;机器学习里把算法分为有监督和无监督的算法,所谓有监督,即我想研究的数据集有目标数据,白话点就是建模里大家 ...

- CDA LEVEL II 数据分析认证考试模拟题库(三十三)
2021-06-11
-
不过,在出题前,要公布上一期LEVEL II中16-20题的答案,大家一起来看!
17、A
19、C
你答对了吗?
21.某公司为更好进行用户留存,需建立用户行为画像,可用以下哪种算法实现?
B.多元线性回归算
...

- CDA LEVEL 1 考试,知识点汇总《聚类分析》
2024-08-13
-
层次聚类法通常分为自底向上和自顶向下。两种方法的运算原理其实是相同的。只不过实际计算是方向相反。 自底向上,又叫做合并法。这种方法是先将每个样本分别作为一个独立的类,然后通过距离计算,将距离相近的两 ...

- CDA LEVEL I 数据分析认证考试模拟题(十九)
2024-09-12
-
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL I的模拟试题时间了,今天给大家带来的是模拟试题(二)中的11-15题。更多题请点击
不过,在出题前,要公布下上一期6-10题的答案,大家一起来看!
6、C
...

- CDA LEVEL I 数据分析认证考试模拟题库(三)
2020-12-10
-
今天,我们继续给大家出关于CDA LEVEL I 数据分析认证考试模拟题库中的5题,同样的,在出题前公布上一期的正确答案。
6、D
7、D
8、C
9、A
10、A
你都答对了吗?接下来,我们一起来做11-15 ...

- 异常检测原理与实验
2018-08-19
-
异常检测原理与实验
最近需要对欺诈报价进行识别处理,简单的模型就是给定很多不同数据集,需要找出每个spu下可能存在的欺诈数据,比如{20,22,30},其中的欺诈数据可能就是30。其实加以抽象,属于异常检测范围。 ...

- 一种面向高维数据的集成聚类算法
2018-06-10
-
一种面向高维数据的集成聚类算法
聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,得到一个能较好地反映数据集内在结构的数据划分。很多学者的研究证明聚类集成能有效 ...

- 对数据科学家来说最重要的算法和统计模型
2018-05-31
-
对数据科学家来说最重要的算法和统计模型
作为一个在这个行业已经好几年的数据科学家,在LinkedIn和QuoLa上,我经常接触一些学生或者想转行的人,帮助他们进行机器学习的职业建议或指导方面相关的课程选择。一 ...
- SPSS聚类分析:系统聚类分析
2017-12-18
-
SPSS聚类分析:系统聚类分析
一、概念:(分析-分类-系统聚类)
系统聚类法常称为层次聚类法、分层聚类法,也是聚类分析中使用广泛的一种方法。它有两种类型,一是对研究对象本身进
行分类,称为Q ...
- 大数据十大经典算法之k-means
2017-11-13
-
大数据十大经典算法之k-means
k均值算法基本思想:
K均值算法是基于质心的技术。它以K为输入参数,把n个对象集合分为k个簇,使得簇内的相似度高,簇间的相似度低。
处理流程:
1、为每个聚类确定一个 ...

- 学会数据分析背后的挖掘思维,分析就完成了一半
2017-08-09
-
学会数据分析背后的挖掘思维,分析就完成了一半
在数据分析中,模型是非常有用和有效的工具和数据分析应用的场景,在建立模型的过程中,数据挖掘很多时候能够起到非常显著的作用。伴随着计算机科学的发展,模型也越 ...
- R语言多元分析系列
2017-07-21
-
R语言多元分析系列
R语言多元分析系列之一:主成分分析
主成分分析(principal components analysis,
PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...

- 数据分析实例--R语言如何对垃圾邮件进行分类
2017-07-07
-
数据分析实例--R语言如何对垃圾邮件进行分类
Structure of a Data Analysis
1 数据分析的步骤
l Define the question
l Define the ideal data set
l Determine what data ...

- 好课推荐丨CDA建模分析师-R语言
2017-05-05
-
数据科学家被认为是21世纪最性感也是最具发展前景的职业,目前有75%左右的数据科学家使用R语言,有35%左右的数据科学家将R语言作为首选统计分析工具。今天,我们来了解一下R语言的前世今生。
一、R的 ...

- 数据挖掘的常用方法、功能和一个聚类分析应用案例
2017-05-04
-
数据挖掘的常用方法、功能和一个聚类分析应用案例
一、数据挖掘的常用方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不 ...

- 数据挖掘:手把手教你做文本挖掘
2017-05-03
-
数据挖掘:手把手教你做文本挖掘
1文本挖掘定义
文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算 ...

- 机器理解大数据的秘密:聚类算法深度详解
2017-04-03
-
机器理解大数据的秘密:聚类算法深度详解
在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍, ...

- 数据挖掘方法功能和聚类分析案例
2017-03-01
-
数据挖掘方法功能和聚类分析案例
一、数据挖掘的常用方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行 ...

- R语言的三种聚类方法
2017-02-24
-
R语言的三种聚类方法
一、层次聚类
1)距离和相似系数
r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离 ...

- 聚类分析案例之市场细分
2017-02-24
-
聚类分析案例之市场细分
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。
聚 ...