强关联规则
则关联规则 称为「强关联规则」,否则为「弱关联规则」。在挖掘关联规则时,产生的关联规则需要经过 和 的度量
- 对于关联规则 ,它是一个强关联规则
- 对于关联规则 ,它是一个弱关联规则
- 发掘频繁项集:也就是事务支持度 大于预先给定的最小阈值的项的集合。该项集的每一个出现的频繁型
- 产生关联规则:使用频繁项集来产生数据库中置信度 大于预先给定的最小阈值的关联规则
主要挑战:会产生大量满足 的项集,尤其当 设置得很低的时候。例如一个长度为 100 的频繁项集 包含的频繁项集的个数为
由于算力问题,这样的问题无法进行存储和计算。因此需要寻找保持了频繁项集的完整信息的简约表示。