A.有放回简单随机抽样 B.无放回简单随机抽样 C.分层抽样 D.整群抽样
多项选择题如果整个数据分析模型完成后,发现效果不良,考虑从哪些步骤入手改进?()
A.数据清洗是否到位 B.数据理解是否有偏差 C.模型选择是否合适 D.参数调整是否合理
多项选择题在一个二分类的分类预测问题中,如果二分类中的某一类占比超过80%,那么可以考虑哪些方法去改进?()
A.改变模型,例如使用朴素贝叶斯等对偏斜不敏感的模型 B.升采样 C.降采样 D.盖帽法
多项选择题以下哪些方法属于对异常值或极端值的处理方法?()
A.先聚类,然后用同类的均值填充 B.距离均值大于三倍标准差的值使用三倍标准差的值替代 C.用均值填充 D.超出1.5倍IQR的值使用1.5倍IQR的值替代
多项选择题分类型变量的缺失值可以怎样填充?()
A.均值 B.额外增加一类标签表示缺失 C.中位数 D.众数
多项选择题离散型变量使用以下哪个统计量进行缺失值填补较合适?()
A.均值 B.最大值 C.中位数 D.众数