A.随机抽样(Random Sampling)B.分层抽样(Stratified Sampling)C.聚类抽样(Cluster Sampling)D.系统抽样(Systematic Sampling)
单项选择题假设要分析的数据中包含Age这个字段。Age字段的值若由小到大排序,其结果如下:13,15,16,18,20,22,24,28,32,33,37,40,44,48,50,52,55,58。请利用等宽装箱法(Equal-Width-Interval)将数据离散化(Discretization)成3个区段。离散化后的结果应为?()
A.区段一:13,15,16,18,20,22,24,28区段二:32,33,37,40,44区段三:48,50,52,55,58B.区段一:13,15,16,18,20区段二:24,28,32,33,37,40区段三:44,48,50,52,55,58C.区段一:13,15,16,18,20区段二:22,24,28,32,33,37区段三:40,44,48,50,52,55,58D.区段一:13,15,16,18,20,22,24区段二:28,32,33,37,40区段三:44,48,50,52,55,58
单项选择题以下哪种变量筛选方法需要同时设置进出模型的变量显著性阈值()
A.向前逐步法B.向后逐步法C.逐步法D.全子集法
单项选择题构造多分类模型时,在变量粗筛阶段,以下哪个方法最适合对连续型变量进行粗筛()
A.相关系数B.卡方检验C.方差分析D.T检验
单项选择题关于数据清洗(缺失值、异常值),以下哪个叙述是正确的()
A.运用验证数据集中变量的统计量对训练集中的变量进行数据清洗B.运用验证数据集中变量的统计量对验证集中的变量进行数据清洗C.运用训练数据集中变量的统计量对验证集中的变量进行数据清洗D.以上均不对
单项选择题下列等宽(Equal-Width-Interval)装箱法的描述,何者正确()
A.运行速度较等分(Equal-Frequency-Interval)装箱法慢B.每个箱子的范围(Range)不固定C.无法针对分区后各个数据集的特征做数据清洗D.有些箱子可能没有数据