A.因子分析B.变量聚类C.主成分分析D.样本聚类
多项选择题以下哪个是对分类变量进行归类压缩的常见原因()
A.避免某分类中Y缺乏变异的问题B.避免在模型中出现过多的哑变量C.避免解释变量共线性D.避免显性样本过少
多项选择题以下哪个方法属于盖帽法()
A.删去大于三倍标准差的值B.距离均值大于三倍标准差的值使用三倍标准差的值替代C.删去1.5倍IQR的值D.超出1.5倍IQR的值使用1.5倍IQR的值替代
多项选择题对数值字段作离散化,有哪些优点()
A.可使数据精简B.可支持许多无法处理数值型字段的算法C.可提高分类器的稳定性D.可降低数据的复杂度
多项选择题连续变量使用以下哪个统计量进行缺失值填补较合适()
A.均值B.最大值C.中位数D.最小值
多项选择题以下哪两个算法最容易受到离群值的影响()
A.KNNB.决策树C.等宽装箱法D.等分装箱法