干货 | 全面理解无监督学习基础知识

发布时间：2019-03-29 23:26:24 所属栏目：建站来源：Evanyzh

导读：一、无监督学习无监督学习的特点是，模型学习的数据没有标签，因此无监督学习的目标是通过对这些无标签样本的学习来揭示数据的内在特性及规律，其代表就是聚类。与监督学习相比，监督学习是按照给定的标准进行学习(这里的标准指标签)，而无监督学习则是按

其中干货 | 全面理解无监督学习基础知识为混合系数且。使用高斯混合聚类其实是假设样本是在高斯混合分布中采样的结果。对于样本我们可以通过计算

干货 | 全面理解无监督学习基础知识

得出某样本由第i个高斯分布生成的后验概率，，该样本的类别为使得该概率最大的分布的类别。有关于高斯混合模型的具体介绍，将会与EM算法一起介绍。

密度聚类

顾名思义，密度聚类从样本密度的角度来考察样本之间的关联性，其经典算法为DBSCAN，该算法通过设置的邻域和样本邻域内最少样本点数为标准设置核心对象，倘若核心对象密度相连则将它们合并到同一簇，因此DBSCAN的聚类结果的一个簇为最大的密度相连的样本集合。以下是DBSCAN的一些概念的定义：

上面MinPts = 3，虚线表示核心对象的邻域。X1与X2密度直达，X1与X3密度可达X3与X4密度相连。

DBSCAN能够将足够高密度的区域划分成簇，并能在具有噪声的空间数据库中发现任意形状的簇。

层次聚类

层次聚类开始时把所有的样本归为一类，然后计算出各个类之间的距离，然后合并距离最小的两个类。从上面的描述来看，层次聚类就像是在用克鲁斯卡尔算法建立最小生成树一样，不过当层次聚类当前类别数下降到给定的类别数是就会终止。这里层次聚类所使用的聚类是不同类别之间的平均距离。

因为层次聚类所需要计算的距离很多，因此层次聚类并不适合在大的数据集中的使用。

【编辑推荐】

【责任编辑：庞桂玉 TEL：（010）68476606】
点赞 0

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

杭州网站优化的几个注	网站优化效果不好怎么
网站结构怎么优化？对	网站文章内容持续更新