course: - 数据挖掘复制
course: - 数据挖掘
(上课没讲) CLARA 算法(Clustering Large Applications) 是一种距离计算聚类算法。该算法首先获得数据集的多个采样,然后在每个采样上使用K-中心点算法,最后返回最好的聚类结果作为输出。
优点:能够处理大数据集。
缺点