首页 > 行业图谱 >

- 利用Python代码实现数据可视化的5种方法详解
2018-04-20
-
利用Python代码实现数据可视化的5种方法详解
数据科学家并不逊色于艺术家。他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解。更有趣的是,一旦接触到任何可视化的内容、数据时,人类 ...
- R语言简单操作,数值与向量
2018-03-15
-
R语言简单操作,数值与向量
1 向量与赋值
R对命名了的数据结构进行操作。最简单的数据结构是数字向量;如,
> x <- c(10.4, 5.6, 3.1, 6.4, 21.7) c()是创建函数,赋值运算符是\'<-\',与函数a ...

- Python使用三种方法实现PCA算法
2018-01-23
-
Python使用三种方法实现PCA算法
主成分分析,即Principal Component
Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数 ...

- 数据挖掘十大经典算法之K最近邻算法
2018-01-02
-
数据挖掘十大经典算法之K最近邻算法
k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。
基于实例的学习
1.已知一系列的训练样例,很多学习 ...

- 如何实现降维处理(R语言)
2017-12-07
-
如何实现降维处理(R语言)
现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...
- SPSS回归分析:有序回归
2017-11-21
-
SPSS回归分析:有序回归
一、概念(分析-回归-有序)
使用序数回归可以在一组预测变量(可以是因子或协变量)上对多歧分序数响应的依赖性进行建模。序数回归的设计基于McCullagh (1980, 1998)的方 ...
- SPSS广义线性模型:广义估计方程
2017-11-08
-
SPSS广义线性模型:广义估计方程
一、广义估计方程:
1、概念:广义估计方程过程对广义线性模型进行了扩展,以允许分析重复的测量或其他相关观察数据,例如聚类数据。
2、示例。公共卫生官员 ...

- 数据科学的基本内容
2017-10-31
-
数据科学的基本内容
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

- 一个优雅地探索相关性的新可视化方法
2017-08-27
-
一个优雅地探索相关性的新可视化方法
一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长。不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集 ...

- 机器学习中的各种相似性、距离度量
2017-07-25
-
机器学习中的各种相似性、距离度量
本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。
1. 闵可夫斯基距离
基本认识
该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

- R语言与回归分析几个假设的检验
2017-07-22
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
- R语言多元分析系列
2017-07-21
-
R语言多元分析系列
R语言多元分析系列之一:主成分分析
主成分分析(principal components analysis,
PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
- R语言判别分析
2017-07-19
-
R语言判别分析
本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参 ...
- R语言因子分析
2017-07-18
-
R语言因子分析
因子模型: X=μ + A*F* + ε
其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。
I.参数估计
为了建立因子模型,需要要 ...
- R语言方差分析ANOVA
2017-07-18
-
R语言方差分析ANOVA
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。
I. 单因素方差分析
#用data frame的格式输入数据
medicine <- data.frame( ...

- 广义线性模型中的Gauss Seidel 迭代算法实现
2017-06-28
-
广义线性模型中的Gauss Seidel 迭代算法实现
数值模拟的算法迭代公式推导
R代码实现
根据以上公式,代入迭代步骤,即可实现算法。
##------数据模拟--------
library(MASS)
##mvrnorm()
##定义一个 ...

- 时间序列分析算法【R详解】
2017-06-10
-
时间序列分析算法【R详解】
在商业应用中,时间是最重要的因素,能够提升成功率。然而绝大多数公司很难跟上时间的脚步。但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来。不要担心,本文并不会 ...

- R语言解读资本资产定价模型CAPM
2017-05-30
-
R语言解读资本资产定价模型CAPM
伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...

- 利用SPSS进行主成分分析
2017-05-02
-
利用SPSS进行主成分分析
【例子】 以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。
图1 原始数据(未经标准化)
第二步:打开“因子分析”对话框。
沿着主菜 ...
- SPSS的特点
2017-04-22
-
SPSS的特点
1、 操作简单:除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过“菜单”、“按钮”和“对话框”来完成。
2、
无须编程:具有第四代语言的特点,告诉系统要做什么, ...