性质
「距离度量」是连续型属性的相似性计算方法,可用于
距离计算聚类
距离度量
通常需要满足如下性质
非负性
对称性
直递性
可以理解为
三角不等式
离散属性和连续属性
连续属性:在定义域上有无穷多个可能的取值,亦称「数值属性」
离散属性:在定义域上有有限个取值
有序属性和无序属性
有序属性,能够直接在属性之上计算距离,例如定义域为 1,2,3 这样的属性,可以直接计算距离,如
Manhattan 距离
,
Euclidean 距离
和
Minkowski 距离
无序属性,不能直接在属性上计算距离。对于无序属性可以使用
VDM 距离
。
将
Minkowski 距离
和
VDM 距离
距离结合即可处理混合属性。假定有
个有序属性,
个无序属性,令有序属性排在无序属性之前,则
当样本空间中不同属性重要性不同时,可用加权后的距离。
Interactive Graph
Table Of Contents
性质
非负性
对称性
直递性
离散属性和连续属性
有序属性和无序属性