可能性矩阵

二元属性相似性度量中,一个二元属性只有两种状态,0 或 1,一个对象可以包含多个二元属性。如何计算两个二元属性之间的相异度?假设:

  • 每个对象有 个属性
  • 是对象 都取 的属性数
  • 是对象 都取 的属性数
  • 是在对象 中取 ,在对象 中取 1 的属性数
  • 是在对象 中取 ,在对象 中取 0 的属性数

显然有 ,则可以做出下面的「可能性矩阵」

- 1 0 sum
1
0 t
sum