A.删去大于三倍标准差的值B.距离均值大于三倍标准差的值使用三倍标准差的值替代C.删去1.5倍IQR的值D.超出1.5倍IQR的值使用1.5倍IQR的值替代
多项选择题对数值字段作离散化,有哪些优点()
A.可使数据精简B.可支持许多无法处理数值型字段的算法C.可提高分类器的稳定性D.可降低数据的复杂度
多项选择题连续变量使用以下哪个统计量进行缺失值填补较合适()
A.均值B.最大值C.中位数D.最小值
多项选择题以下哪两个算法最容易受到离群值的影响()
A.KNNB.决策树C.等宽装箱法D.等分装箱法
单项选择题在数据预处理的过程中,通常花最多时间的部份是在哪个阶段()
A.数据清洗B.字段选择C.数据编码D.字段扩充
单项选择题错误值(Wrong Value)的处理是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段?()
A.数据清洗B.数据选择C.数据编码D.数据扩充