通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。 表1
A.0 B.0.23 C.0.68 D.0.268
单项选择题测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Yes|x)=()
A.0.0132/(P(age=youth,income=medium,student=no,crediting_rating=excellent)) B.0.0132 C.0.067 D.0.568
单项选择题表3是由表2得到的,表3中M和N的值分别为?() 表3
A.9/14和0 B.1和1/5 C.9/14和1/5 D.0和1
单项选择题表2是由表1的数据得到的,表2中的M和N的值应该分别为?() 表2
A.14和5 B.5和3 C.9和0 D.9和5
单项选择题如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
A.用训练集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 B.用测试集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 C.用全部数据集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 D.以上皆可
单项选择题关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集 B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值 C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值 D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值