course:
- 数据挖掘
- 机器学习
AGNES (Agglomerative Nesting) 是一种采用自底向上层次聚类策略的层次聚类算法。AGNES 算法最初将每个对象作为一个簇,然后这些簇根据某些准则被逐步合并。
两个簇间的相似度由这两个不同簇中距离最近的数据点对的相似度来确定。聚类的合并过程反复进行直到所有对象最终属于同一个簇或达到一个终止条件。
此过程可以概括为
合并准则:每次找到距离最近的两个簇进行合并。两个簇之间的距离由这两个簇中距离最近的样本点之间的距离来表示。关键在于,如何计算聚类簇之间的距离?
输入:样本集
输出:
过程:
为了研究辽宁省等五省区某年度城镇居民生活消费的分布规律,对如下调查数据进行聚类。
省份 | ||||||||
---|---|---|---|---|---|---|---|---|
辽宁 | 7.90 | 39.77 | 8.49 | 12.94 | 19.27 | 11.05 | 2.04 | 13.29 |
浙江 | 7.68 | 50.37 | 11.35 | 13.30 | 19.25 | 19.25 | 2.75 | 14.87 |
河南 | 9.42 | 27.93 | 8.20 | 8.14 | 16.17 | 16.17 | 1.55 | 9.76 |
甘肃 | 9.16 | 27.98 | 9.01 | 9.32 | 15.99 | 15.99 | 1.82 | 11.35 |
青海 | 10.06 | 28.64 | 10.52 | 10.05 | 16.18 | 16.18 | 1.96 | 10.81 |
解:
注意到
注意到
注意到