层次聚类

「层次聚类(Hierarchical Clustering)」试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集的划分可采用「自顶向上」的聚合策略,也可采用「自顶向下」的分叉策略

  • 自底向上层次聚类:开始时,将每个样本作为单独的一个组;然后,依次合并相近的样本或组,直至所有样本或组被合并为一个组或者达到终止条件为止。
  • 自顶向下层次聚类:开始时,将所有样本置于一个簇中;然后,执行迭代,在迭代的每一步中,一个簇被分裂为多个更小的簇,直至每个样本分别在一个单独的簇中或者达到终止条件为止。

img-2024-04-30 10-39-00.png

多阶段聚类

特点

可伸缩性不好,合并或分裂需要很大的计算开销,时间复杂度至少是