强关联规则

关联挖掘中,如果关联规则 同时满足

则关联规则 称为「强关联规则」,否则为「弱关联规则」。在挖掘关联规则时,产生的关联规则需要经过 的度量

若设定 ,则

  • 对于关联规则 ,它是一个强关联规则
  • 对于关联规则 ,它是一个弱关联规则

挖掘关联规则 的问题可以分成两个子问题

  • 发掘频繁项集:也就是事务支持度 大于预先给定的最小阈值的项的集合。该项集的每一个出现的频繁型
  • 产生关联规则:使用频繁项集来产生数据库中置信度 大于预先给定的最小阈值的关联规则

主要挑战:会产生大量满足 的项集,尤其当 设置得很低的时候。例如一个长度为 100 的频繁项集 包含的频繁项集的个数为

由于算力问题,这样的问题无法进行存储和计算。因此需要寻找保持了频繁项集的完整信息的简约表示。