A.运行速度较慢 B.程序不能够加密 C.只能在Linux上运行 D.拥有大量的第三方库
判断题在进行建模预测时,对于类别型变量可以采用将其数值化的方法处理。
多项选择题在数值型变量中有数值缺失时,可以用()进行填充。
A.平均值 B.最大值 C.最小值 D.中位数 E.随机值
单项选择题在预测“泰坦尼克号”生存率时,所用的数据集中三个CSV文件是()
A.只有训练集 B.只有测试集 C.其中2个文件是训练集和测试集,另一个是说明文件 D.训练集1个文件,测试集2个文件
多项选择题数据预处理的基本方法包括:()
A.填写缺失的值 B.光滑噪声数据 C.识别或删除离群点 D.解决数据不一致性
多项选择题属于大数据分析步骤是()
A.收集数据 B.数据预处理,应对数据复杂性 C.数据分析 D.理解业务需求和场景