编辑回复: 总结的不错,都可以看下。
编辑回复: 对的 是Apriori和FP-Growth的特点。
编辑回复: 置信度和提升度是对频繁项集的一种验证,在筛选最优组合的时候,一般会设置最小支持度,最小置信度,这样频繁项集和关联关系都要满足这个条件。提升度 (A→B)= 置信度 (A→B)/ 支持度 (B),所以提升度是对满足前两者条件的另一种验证方式,这样避免一种情况:置信度(A->B)很高,是因为本身支持度(B)很高,实际上和A的出现关系不大。
作者回复: 可以用于筛选,比如itemsets, rules = apriori(data, min_support=0.5, min_confidence=1)
编辑回复: FP -Growth中有一个概念叫:条件模式基。它在FP树创建的时候还用不上,创建的时候主要是通过扫描整个数据,和项头表来构造FP树。条件模式基用于挖掘频繁项的过程。通过数找到每个项(item)的条件模式基,递归挖掘频繁项集