判断题处理40PB容量的数据就是大数据处理。
问答题依据类信息可利用的程度,离群点挖掘可分为哪三种基本方法?
问答题简述离群点挖掘问题的构成。
问答题为什么要关注离群点?
问答题下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热狗的事务,指不包含热狗的事务。hamburgers指包含汉堡的事务,指不包含汉堡的事务。 假设挖掘出的关联规则是“hot dogs=>hamburgers”。给定最小支持度阈值25%和最小置信度阈值50%,这个关联规则是强规则吗? 计算关联规则“hot dogs=>hamburgers”的提升度,能够说明什么问题?购买热狗和购买汉堡是独立的吗?如果不是,两者间存在哪种相关关系?