数据集如下表所示: (a)把每一个事务作为一个购物篮,计算项集{e},{b,d}和{b,d,e}的支持度。 (b)利用(a)中结果计算关联规则{b,d}→{e}和{e}→{b,d}的置信度。置信度是一个对称的度量吗? (c)把每一个用户购买的所有商品作为一个购物篮,计算项集{e},{b,d}和{b,d,e}的支持度。 (d)利用(b)中结果计算关联规则{b,d}→{e}和 {e}→{b,d}的置信度。置信度是一个对称的度量吗?
(c)如果把每一个用户购买所有的所有商品作为一个购物篮,则 (d)利用c中结果计算关联规则{b,d}→{e}和{e}→{b,d}的置信度,则 置信度不是一个对称的度量
问答题列举关联规则在不同领域中应用的实例。
问答题什么是频繁项集?
问答题下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之间的SNN相似度。
问答题什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。
问答题假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两个簇C1、C2的信息如下,分别求出记录和簇彼此之间的距离。(k-means算法的拓展) p={男,广州,18},q={女,深圳,20} C1={男:25,女:5;广州:20,深圳:6,韶关:4;19} C2={男:3,女:12;汕头:12,深圳:1,湛江:2;24}