机器学习里的无监督学习是什么？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代机器学习里的无监督学习是什么？

机器学习里的无监督学习是什么？

2020-06-30

无监督学习是机器学习里的一种学习方式，下面将给大家具体解释一下无监督学习到底是什么?

首先我们可以对照监督学习来对比理解一下无监督学习的概念。

机器学习中，监督学习是一种明确的训练方式，你能够很明确知道自己得到的是什么，并且由于明确了目标，所以能够衡量效果。在监督学习中，我们需要需要给数据打标签，然后根据这些标注了的数据来拟合一个假设函数。

而无监督学习则不同，它没有明确目的，我们无法提前知道结果是什么，所以几乎无法进行效果衡量。而且无监督学习中数据没有标签，我们需要把这些无标签数据输入到一个算法中，然后要求这个算法帮我们在这个数据集中找到它的内在结构。

无监督学习常见的两种类型是：聚类和数据集变换。

简单说聚类就是一种自动分类的方法，将数据划分成不同的组，每组包含相似的物项。但是我们可能并不清楚聚类后的几个分类每个代表什么意思。举个例子，用户在某个网站上传了照片，网站可能想要将同一用户的照片分在一组。但网站对于每张照片是谁，照片集中总共出现了多少个人并不清楚。比较明智的解决方法是提取所有照片中的人脸，把看起来相似的人脸分在一组，这样就完成了对图片的分组了。

数据集变换，就是创建数据集新的表示算法，对于这种新的表示，机器学习算法可能更容易理解。

常见的应用是降维，就是找到能够表示拥有许多特征的高维数据的一种新方法，用较少的特征就可以概括其重要特性。看上去很像压缩，但其实是为了既能尽可能保存相关的结构，又能同时降低数据的复杂度。另一个应用就是找到“构成”数据的各个组成部分，比如在文本文档中进行关键字提取。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；