从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称有知识发现、数据分析、数据融合、决策支持等。 数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等。
问答题为什么要建立数据仓库?
多项选择题根据关联分析中所涉及的数据维,可以将关联规则分类为()。
A.布尔关联规则B.单维关联规则C.多维关联规则D.多层关联规则
多项选择题根据关联分析中所涉及的抽象层,可以将关联规则分类为()。
A.布尔关联规则 B.单层关联规则 C.多维关联规则 D.多层关联规则
多项选择题Apriori算法所面临的主要的挑战包括()。
A.会消耗大量的内存 B.会产生大量的候选项集 C.对候选项集的支持度计算非常繁琐 D.要对数据进行多次扫描
单项选择题置信度(confidence)是衡量兴趣度度量()的指标。
A.简洁性 B.确定性 C.实用性 D.新颖性