A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小 B.不能避免不平衡数据标签的偏差性 C.Lift越大,数据质量越大 D.如果lift=1,说明两个事项有正向关联
多项选择题非频繁模式是指()。
A.其支持度小于阈值 B.都是不让人感兴趣的 C.包含负模式和负相关模式 D.对异常数据项敏感
多项选择题属于簇有效性的监督度量是:()
A.轮廓系数 B.共性分类相关系数 C.熵 D.F度量
多项选择题在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
A.将负样本重复10次,生成10w样本量,打乱顺序参与分类 B.直接进行分类,可以最大限度利用数据 C.从10w正样本中随机抽取1w参与分类 D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
多项选择题在统计模式识分类问题中,当先验概率未知时,可以使用()?
A.最小损失准则 B.N-P判决 C.最小最大损失准则 D.最小误判概率准则
多项选择题在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
A.构建决策树输入数据的随机选取 B.构建决策树分裂节点的随机选取 C.构建决策树树的数量的随机选取 D.构建决策树所需特征的随机选取