简介

已完成

聚类分析是使用类似对象对对象进行分组的过程。 例如,在下图中,我们有一个 2D 坐标集合,其中坐标已聚类为三个类别 - 左上方(黄色)、底部(红色)和右上方(蓝色)。

黄色、红色和蓝色群集。

聚类分析模型和分类模型之间的主要区别在于聚类分析是一种非监督式方法,其中训练是在无标签的情况下完成的。 聚类分析模型会识别具有类似功能集合的示例。 在上图中,位于类似位置的示例分在一组。

聚类分析常用于浏览新数据,其中数据点之间的模式(例如高级类别)尚不清楚。 它用于需要自动标记复杂数据的许多字段,包括社交网络分析、大脑连接、垃圾邮件筛选等。