A.不一致 B.重复 C.不完整 D.含噪声
多项选择题如果参与分类的变量是连续变量,则适用的聚类方法有()
A.层次聚类法 B.K-均值聚类法 C.两步聚类法 D.混合聚类法
多项选择题关于对决策树进行剪枝的说法中正确的是()
A.先剪枝和后剪枝都可以降低决策树的过拟合风险 B.后剪枝决策树的训练时间会比先剪枝决策树和未剪枝决策树长很多 C.先剪枝和后剪枝都是利用验证集精度来判断是否剪枝的 D.一般来说,后剪枝要比先剪枝的效果好很多
多项选择题下列关于脏数据的说法中,正确的是()
A.格式不规范B.编码不统一C.意义不明确D.与实际业务关系不大
多项选择题对于算术平均数的特点,下列说法正确的是()
A.容易受到异常值的影响 B.综合反映全部数据的信息 C.适用于连续型数据 D.可用于推算总体中的总量指标
多项选择题系统聚类法的局限性在于()
A.可能没有确定的、一致的正确答案 B.一般无法处理大型数据 C.灵活性较高 D.缺乏伸缩性,一旦一个合并或者分裂被执行,就不能撤销