1)可伸缩性 2)处理不同类型属性的能力 3)发现任意形状的聚类 4)用于决定输入参数的领域知识最小化 5)处理噪声数据的能力 6)对输入记录的顺序不敏感 7)高维度 8)基于约束的聚类 9)可解释性和可用性
问答题简述典型的聚类分析任务包括的步骤。
问答题考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1 2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?
问答题考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?
问答题评估分类模型的性能的方法有哪些?
问答题简述分类模型性能评价的指标。