通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。 表1
表2是由表1的数据得到的,表2中的M和N的值应该分别为?() 表2
A.14和5 B.5和3 C.9和0 D.9和5
单项选择题如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
A.用训练集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 B.用测试集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 C.用全部数据集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。 D.以上皆可
单项选择题关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集 B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值 C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值 D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值
单项选择题ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.A/(A+B) B.A/(A+D) C.B/(B+C) D.C/(B+C)
单项选择题ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.C/(C+D) B.D/(A+D) C.B/(B+C) D.C/(B+C)
多项选择题根据购物篮分析的目标,最有用的规则是那些具有高支持度、信度和升度的规则,除此之外,也需要参考Lift(升度),以下关于“Lift”说法正确的是()
A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小 B.不能避免不平衡数据标签的偏差性 C.Lift越大,数据质量越大 D.如果lift=1,说明两个事项有正向关联