A.改变模型,例如使用朴素贝叶斯等对偏斜不敏感的模型 B.升采样 C.降采样 D.盖帽法
多项选择题以下哪些方法属于对异常值或极端值的处理方法?()
A.先聚类,然后用同类的均值填充 B.距离均值大于三倍标准差的值使用三倍标准差的值替代 C.用均值填充 D.超出1.5倍IQR的值使用1.5倍IQR的值替代
多项选择题分类型变量的缺失值可以怎样填充?()
A.均值 B.额外增加一类标签表示缺失 C.中位数 D.众数
多项选择题离散型变量使用以下哪个统计量进行缺失值填补较合适?()
A.均值 B.最大值 C.中位数 D.众数
多项选择题以下几项中,可以归于知识发掘处理(Knowledge Discovery Process)中的数据清洗阶段的有()
A.异常值处理 B.缺失值处理 C.预测结果可视化输出 D.理解业务背景
多项选择题当遇到解释变量有多重共线性问题时,可以采取以下哪些方法以解决多重共线性问题:()
A.变量剔除 B.降维 C.更换模型 D.增添交互效应