找考题网-背景图
问答题

计算题

一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。

(a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。
(b)比较穷举法和Apriori算法生成的候选项集的数量。
(c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。

【参考答案】

(a)频繁1-项集:M,O,K,E,Y
频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E}
频繁3-项集:{O,K,E}
(b)穷举法:M=2k-1=211-1=2047
Apriori算法:2......

(↓↓↓ 点击‘点击查看答案’看完整答案 ↓↓↓)