cda

数字化人才认证

首页 > 行业图谱 >

机器学习经典算法之k-means聚类

机器学习经典算法之k-means聚类
2020-06-10
K-means算法旨在选择一个质心, 能够最小化惯性或簇内平方和的标准: K-means算法原理分析 首先随机选取K个初始质心,最基本的方法是从数据集$X$中选择$K$个样本。 将每 ...

百闻不如一练:随机森林等可视化调试模型超参数

百闻不如一练:随机森林等可视化调试模型超参数
2020-06-10
以下使用scikit-learn中数据集进行分享。 如果选用随机森林作为最终的模型,那么找出它的最佳参数可能有1000多种组合的可能,你可以使用使用穷尽的网格搜索(Exhaustive Grid Seaarch)方法,但时间成本将会很 ...

层次聚类算法:Affinity Propogation算法学习指南

层次聚类算法:Affinity Propogation算法学习指南
2020-06-10
Affinity Propogation最初是由Brendan Frey 和 Delbert Dueck于2007年在Science上提出的。相比其它的层次聚类算法,Affinity Propogation算法不需要预先指定聚类个数。 Affinity Propogation算法的原理可以简单 ...

python散点图:如何添加拟合线并显示拟合方程与R方?

python散点图:如何添加拟合线并显示拟合方程与R方?
2020-06-08
python散点图:如何添加拟合线并显示拟合方程与R方?我们可以使用polyfit()函数,使用最小二乘法将一些点拟合成一条曲线. numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False) # x:要拟合点的 ...

如何用python绘制简单条形图?

如何用python绘制简单条形图?
2020-06-01
如何用python绘制简单条形图呢?这里离不开matplotlib的使用。 条形图是数据可视化图形中很基础也很常用的一种图,简单解释下:条形图也叫长条图(英语:bar chart),亦称条图(英语:bar graph)、条状图、棒 ...

使用python来绘制漂亮的图表:seaborn篇!

使用python来绘制漂亮的图表:seaborn篇!
2020-05-27
延续上一篇pandas的文章,我们继续来探讨python中的seaborn,能画出多么高级和漂亮的图标。 漂亮:seaborn的高级绘图

使用python来绘制漂亮的图表:pandas篇!

使用python来绘制漂亮的图表:pandas篇!
2020-05-27
使用Python绘制数据,可以使用三种不同方式,它们分别是pandas,Seaborn和Plotly。 我们将通过利用《 2019年世界幸福报告》中的数据来做到这一点。我用Gapminder和Wikipedia的信息丰富了《世界幸福报告》数据,以便 ...

Kmeans算法精简版(无for loop循环)

Kmeans算法精简版(无for loop循环)
2020-05-27
大家在学习算法的时候会学习到关于Kmeans的算法,但是网络和很多机器学习算法书中关于Kmeans的算法理论核心一样,但是代码实现过于复杂,效率不高,不方便阅读。这篇文章首先列举出Kmeans核心的算法过程 ...

机器学习python应用,简单机器学习项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

机器学习python算法应用,监督学习、无监督学习等!

机器学习python算法应用,监督学习、无监督学习等!
2020-05-25
本系列文章主要介绍机器学习在实践中的应用,介绍利用 python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大 ...

seaborn 常用的 10 种数据分析图表

seaborn 常用的 10 种数据分析图表
2020-04-28
内置示例数据集 seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。 # 查看数据集种类 import sea ...

8个流行的Python可视化工具包,你喜欢哪个?

8个流行的Python可视化工具包,你喜欢哪个?
2020-04-28
把这三个包放在一起有几个原因:首先 Seaborn 和 Pandas 是建立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的其实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是 ...

Python数据分析之pandas数据结构

Python数据分析之pandas数据结构
2020-03-31
作者 | CDA数据分析师 之前的文章写了Python的基础知识,从这部分内容开始正式进入到正式的数据分析过程中,主要讲述每个数据分析过程都会用到什么操作,这些操作用Excel是怎样实现 ...

如何通过分类数据执行特征选择?

如何通过分类数据执行特征选择?
2020-03-09
作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是识别和选择与目标变量最相关的输入特征子集的过程。 使用实值数据(例如使用Pearson的相关系数)时,特征选择通常很简单,但是 ...

为何Python技能越来越受到企业的青睐?

为何Python技能越来越受到企业的青睐?
2020-03-24
想要在职场中站稳脚步,掌握一门硬技术是非常重要的事情。顺应时代发展,抓住新的机遇,在如今市场经济不景气的2020年显得尤为重要。数数当下比较热门或高涨的行业,当属数据分析和人工智能领域, ...

Python数据分析之pandas数据结构

Python数据分析之pandas数据结构
2020-01-16
作者 | CDA数据分析师 之前的文章写了Python的基础知识,从这部分内容开始正式进入到正式的数据分析过程中,主要讲述每个数据分析过程都会用到什么操作,这些操作用Excel是怎样实现的,如果用Python,那么 ...

一文讲解机器学习算法中的共线性问题

一文讲解机器学习算法中的共线性问题
2020-01-08
作者 | 宋老师 来源 | JSong的数据科学小站 多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参 ...

Python基础知识详解(四):控制流篇

Python基础知识详解(四):控制流篇
2020-01-08
作者 | CDA数据分析师 循环语句 1、for循环 For循环用来遍历任何序列的项目,这个序列可以是一个列表也可以是一个字符串,针对这个序列中的每个项目去执行相应的操 ...

Python数据清洗(三):异常值识别与处理

Python数据清洗(三):异常值识别与处理
2019-12-20
作者 | 刘顺祥 来源 | 数据分析1480 在《Python数据清洗(一):类型转换和冗余数据删除》和《Python数据清洗(二):缺失值识别与处理》文中已经讲解了有关数据中重复观测和缺失值的识别与处 ...

用OpenCV等构建神经网络,这些实战经验你肯定用得上!

用OpenCV等构建神经网络,这些实战经验你肯定用得上!
2020-05-21
在我们的机器学习实验室,我们在许多高性能的机器已经积累了成千上万个小时的训练。然而,并不是只有计算机在这个过程中学到了很多东西:我们自己也犯了很多错误,修复了很多错误。 我们承认这些都是众所周知 ...

OK
客服在线
立即咨询