首页 > 行业图谱 >

- Python数据分析常用函数笔记
2018-01-10
-
Python数据分析常用函数笔记
1、生成随机数列表
import numpy as np
array = np.random.permutation(20)
结果:
array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19])
2、合并两个p ...

- 多种方法实现Excel批量导入数据库
2018-01-01
-
多种方法实现Excel批量导入数据库
Excel批量导入数据库是用到批量导入系统的一个难题,特别是需要批量导入的Excel表比较复杂,或者这张Excel表需要多表插入的时候,批量导入就变得复杂起来。其实了解了批 ...

- R语言学习路线和常用数据挖掘包
2017-12-13
-
R语言学习路线和常用数据挖掘包
对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是— ...

- python数据清洗系列之字符串处理详解
2017-11-30
-
python数据清洗系列之字符串处理详解
数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80%的时间都是在清洗数据,这听起来有些匪夷所思,但在实际的工作 ...

- 一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
2017-07-17
-
一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
先学了R语言,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 ...

- 针对SAS用户:Python数据分析库pandas
2017-06-21
-
针对SAS用户:Python数据分析库pandas
这篇文章是Randy Betancourt的用于SAS用户的快速入门中的一章。Randy编写这本指南,让SAS用户熟悉Python和Python的各种科学计算工具。
本文包括的主题:
导入包
...

- 2017年最流行的15个数据科学Python库
2017-06-02
-
Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库。
核心 ...

- SPSS常用统计图
2017-05-02
-
SPSS常用统计图
SPSS统计图形的绘制
? 一、概述 ? 二、统计图的分类 ? 三、常用统计图 ? 四、小结
一、概述
? 统计描述:
? 包括统计指标和统计图、表
? 统计图的特征:
? (1)形象化: ? 变抽象的文字为形象 ...
- 谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
-
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

- 利用R语言制作出漂亮的交互数据可视化
2017-02-21
-
利用R语言制作出漂亮的交互数据可视化
利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。
rCharts包
说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接 ...

- python数据分析笔记—数据加载与整理
2017-02-18
-
python数据分析笔记—数据加载与整理
数据加载
导入文本数据
1、导入文本格式数据(CSV)的方法:
方法一:使用pd.read_csv(),默认打开csv文件。
9、10、11行三种方式均可以导入文本 ...

- 快速成为R语言全栈数据分析师
2022-01-20
-
R源自90年代S编程语言的一个开源版本,主要用于统计分析、绘图、数据挖掘,在高校及商业统计分析领域非常受欢迎。最新的O’Reilly数据科学薪资调查也将R列为最高薪的数据科学家使用技能之一。当然,R最吸引人的地方 ...

- 揭秘丨备战CDA数据分析竞赛!
2017-01-16
-
Kaggle是一个数据分析建模的应用竞赛平台,有点类似KDD-CUP(国际知识发现和数据挖掘竞赛),企业或者研究者可以将问题背景、数据、期望指标等发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案 ...

- 聚类分析基础知识总结及实战解析
2016-11-28
-
聚类分析基础知识总结及实战解析
聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分 ...

- 一文读懂19款数据分析软件,解救选择困难症!
2016-10-20
-
一、什么是数据分析?
数据分析既是一门艺术,所谓艺术就是结合技术、想象、经验和意愿等综合因素的平衡和融合。数据分析的目的就是帮助我们把数据(Data)变成信息(Information),再从信息变成知识(Knowledge) ...

- 数据挖掘入门必看10个问题
2016-10-20
-
数据挖掘入门必看10个问题
NO.1 Data Mining 和统计分析有什么不同?
硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法, ...

- 列举数据挖掘领域的十大挑战问题
2016-09-25
-
列举数据挖掘领域的十大挑战问题
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数 ...

- SPSS中Recode、Compute、Count、If命令
2016-08-10
-
SPSS中Recode、Compute、Count、If命令
在进行统计分析时,经常需要对某些数据进行重新处理,如年龄、身高、收入等,了解他们的分布或进行分析。
1、SPSS的数据变换,主要命令有四种:
2、Recode 命令: ...

- 时间序列分析:对非平稳时间序列进行建模
2016-06-15
-
编者按
曾经有位小伙伴在公众号留言提问:如何做时间序列分析?最近C君发现了一篇文章,也许可以解答这个问题,收录在此,以飨读者。本文来自于数据人网。
如果你有数据分析相关的问题,也可以公众号留言提问, ...

- R-Echart可视化实战
2016-05-30
-
本文部分摘自CDA数据科学家训练营课程,版权私有,维权必究,转载请注明出处。
总结一下2016年5月29日数据科学家训练营R语言课程中Echart学习成果,也把上课用Echart做的图表及脚步代码和大家分享。先讲下 ...