A.大数据是数据量变积累达到质变的结果 B.数据的产生需要经历很长时间 C.我们每个人都是数据的制造者 D.当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界
多项选择题下列对ID3算法的描述,正确的是()
A.每个节点的分支度都不相同 B.使用Information Gain作为节点分割的依据 C.可以处理数值型态的字段 D.无法处理空值的字段
多项选择题在客户关系管理中,客户的生命周期都包括()阶段。
A.潜在客户 B.响应客户 C.即得客户 D.流失客户
多项选择题我们可以用哪种方式来避免决策树过度拟合的问题?()
A.利用修剪法来限制树的深度 B.利用盆栽法规定每个节点下的最小的记录数目 C.利用逐步回归法来删除部分数据 D.目前并无适合的方法来处理这问题
多项选择题以下哪些变量使用RFM方法构造出来的?()
A.最近3期境外消费金额 B.最近6期网银消费交易笔数 C.信用额度 D.距最近一次逾期的月数
多项选择题利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是() ID 项集 1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐
A.啤酒、尿布 B.啤酒、面包 C.面包、尿布 D.啤酒、牛奶