1)划分方法(每个划分表示一个聚类) 2)层次方法(将数据对象组成一个聚类树) 3)基于密度的方法(绝大多数划分方法都是基于对象之间的距离大小进行聚类) 4)基于模型的方法(试图将给定数据与某个数学模型搭成最佳拟合) 5)基于图的聚类算法(利用图的许多重要性质和特性)
问答题数据挖掘对聚类的典型要求有哪些?
问答题简述典型的聚类分析任务包括的步骤。
问答题考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1 2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?
问答题考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?
问答题评估分类模型的性能的方法有哪些?