性质

「距离度量」是连续型属性的相似性计算方法,可用于距离计算聚类

距离度量 通常需要满足如下性质

非负性

对称性

直递性

可以理解为三角不等式

离散属性和连续属性

  • 连续属性:在定义域上有无穷多个可能的取值,亦称「数值属性」
  • 离散属性:在定义域上有有限个取值

有序属性和无序属性

  • 有序属性,能够直接在属性之上计算距离,例如定义域为 1,2,3 这样的属性,可以直接计算距离,如Manhattan 距离Euclidean 距离Minkowski 距离
  • 无序属性,不能直接在属性上计算距离。对于无序属性可以使用VDM 距离
  • Minkowski 距离VDM 距离距离结合即可处理混合属性。假定有 个有序属性, 个无序属性,令有序属性排在无序属性之前,则

当样本空间中不同属性重要性不同时,可用加权后的距离。