A.干扰样本清理算法B.异常样本识别算法C.异常样本聚类算法D.决策树算法
多项选择题随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候决定测试样本的最终类别。它的优点是()
A.能够处理高纬度的数据,并且不做特征选择B.每次学习使用不同训练集,一定程度避免过拟合C.在某些噪音较大的分类或回归问题上不会过拟合D.级别划分较多的属性不会影响模型效果
多项选择题在数据挖掘中,以下哪三种算法应用最为广泛()
A.决策树算法B.回归算法C.聚类分析D.神经网络算法
单项选择题集中性能系统的数据源不包括()
A.信令CDR数据B.话务统计数据C.综合资源数据D.业务营销数据
单项选择题当目标是连续变量时,该决策树是()
A.分类树B.回归数C.二分数D.多分树
单项选择题基于数据挖掘分析,开展业务质量分析的分析与预判时,下列哪项说法是错误的()
A.当业务质量分析的样本流量太大,可以结合计算资源能力,通过合理比例的样本抽样,开展指标计算与分析B.对于业务质量的指标分析,选取单个用户的业务访问xdr,即可计算该业务的指标情况,评估该业务是否存在内容资源质差C.不同业务的质量指标通常存在一定差值,该现象与各业务的业务特性、用户行为、内容资源差异等多个因素有关,属于正常现象D.业务质量分析中,通常结合业务指标的历史值(如该指标上周均值)与指标的固定阈值(如成功率是否低于90%),来作为是否出现质差或者劣化的判断依据