A.数值型属性离散化B.类别型属性一般化C.数值型属性正规化D.数值型属性扩充化
多项选择题类别型变量可使用以下哪个统计量进行缺失值的填补()
A.均值B.最大值C.未知(Unknown)D.众数(Mode)
多项选择题以下哪种方法可以用于连续变量的压缩()
A.因子分析B.变量聚类C.主成分分析D.样本聚类
多项选择题以下哪个是对分类变量进行归类压缩的常见原因()
A.避免某分类中Y缺乏变异的问题B.避免在模型中出现过多的哑变量C.避免解释变量共线性D.避免显性样本过少
多项选择题以下哪个方法属于盖帽法()
A.删去大于三倍标准差的值B.距离均值大于三倍标准差的值使用三倍标准差的值替代C.删去1.5倍IQR的值D.超出1.5倍IQR的值使用1.5倍IQR的值替代
多项选择题对数值字段作离散化,有哪些优点()
A.可使数据精简B.可支持许多无法处理数值型字段的算法C.可提高分类器的稳定性D.可降低数据的复杂度