aliases:
- k-medoids
- PAM 算法
course:
- 数据挖掘
「K-中心点算法」(K-medoids)是一种距离计算聚类。选取有代表性的样本来表示整个簇,即选取最靠近「中心点」的那个样本来代表整个簇。可以降低聚类算法对离群点的敏感度。
如果代表样本能被非代表样本所替代,则替代产生的总代价
其中,
当非代表样本
输入:聚类簇数
输出:
过程:
假设空间中的五个点
样本点 | A | B | C | D | E |
---|---|---|---|---|---|
A | 0 | 1 | 2 | 2 | 3 |
B | 1 | 0 | 2 | 4 | 3 |
C | 2 | 2 | 0 | 1 | 5 |
D | 2 | 4 | 1 | 0 | 3 |
E | 3 | 3 | 5 | 3 | 0 |
用
解:
第一步,建立节点,假设初始抽取的中心点为
第二步,开始交换。现以