根据以下混淆矩阵和ROC曲线,回答以下两题:
A.A/(A+B) B.A/(A+D) C.B/(B+C) D.C/(B+C)
单项选择题ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.C/(C+D) B.D/(A+D) C.B/(B+C) D.C/(B+C)
多项选择题根据购物篮分析的目标,最有用的规则是那些具有高支持度、信度和升度的规则,除此之外,也需要参考Lift(升度),以下关于“Lift”说法正确的是()
A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小 B.不能避免不平衡数据标签的偏差性 C.Lift越大,数据质量越大 D.如果lift=1,说明两个事项有正向关联
多项选择题非频繁模式是指()。
A.其支持度小于阈值 B.都是不让人感兴趣的 C.包含负模式和负相关模式 D.对异常数据项敏感
多项选择题属于簇有效性的监督度量是:()
A.轮廓系数 B.共性分类相关系数 C.熵 D.F度量
多项选择题在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
A.将负样本重复10次,生成10w样本量,打乱顺序参与分类 B.直接进行分类,可以最大限度利用数据 C.从10w正样本中随机抽取1w参与分类 D.将负样本每个权重设置为10,正样本权重为1,参与训练过程