在聚类中,对于数据集 ,假定通过聚类给出的簇划分为 ,参考模型给出的簇划分为 ,相应地,令 与 分别表示与 和 对应的簇标记向量。
我们将样本两两配对,定义:
由于每个样本对 仅能出现在一个集合中,因此有
则定义「FM 指数」为
显然 FM 指数值在 之间,越大表示聚类性能越好