问答题
计算题
一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。
(a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。
(b)比较穷举法和Apriori算法生成的候选项集的数量。
(c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
【参考答案】
(a)频繁1-项集:M,O,K,E,Y
频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E}
频繁3-项集:{O,K,E}
(b)穷举法:M=2k-1=211-1=2047
Apriori算法:2......
(↓↓↓ 点击‘点击查看答案’看完整答案 ↓↓↓)