利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是() ID 项集 1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐
A.啤酒、尿布 B.啤酒、面包 C.面包、尿布 D.啤酒、牛奶
多项选择题分箱方法有哪些?()
A.等深分箱B.等宽分箱C.数据标准化D.自定义区间法
多项选择题以下属于数据预处理的是()
A.缺失值填充 B.噪声数据剔除 C.异常值识别 D.数据可视化
多项选择题大数据在今天这个时间点上爆发的原因有哪些?()
A.各种传感器无时无刻不在为我们提供大量的数据 B.各种监控设备无时无刻不在为我们提供大量的数据 C.各种智能设备无时无刻不在为我们提供大量的数据 D.互联网的收集和积累
多项选择题以下说法正确的有哪些?()
A.大数据仅仅是讲数据的体量大 B.大数据对传统行业有帮助 C.大数据会带来机器智能 D.大数据是一种思维方式
多项选择题缺失值的处理方法有哪些?()
A.用平均值填充 B.忽略缺失记录 C.以任意数据填充 D.用默认值填充