通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。 表1
表3是由表2得到的,表3中M和N的值分别为?() 表3
A.9/14和0 B.1和1/5 C.9/14和1/5 D.0和1
单项选择题表2是由表1的数据得到的,表2中的M和N的值应该分别为?() 表2
A.14和5 B.5和3 C.9和0 D.9和5
单项选择题如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
A.用训练集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 B.用测试集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 C.用全部数据集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 D.以上皆可
单项选择题关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集 B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值 C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值 D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值
单项选择题ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.A/(A+B) B.A/(A+D) C.B/(B+C) D.C/(B+C)
单项选择题ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.C/(C+D) B.D/(A+D) C.B/(B+C) D.C/(B+C)