A.构建决策树输入数据的随机选取 B.构建决策树分裂节点的随机选取 C.构建决策树树的数量的随机选取 D.构建决策树所需特征的随机选取
多项选择题假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是?()
A.这个被重复的特征在模型中的决定作用会被加强 B.模型效果相比无重复特征的情况下精确度会降低 C.如果所有特征都被重复一遍,得到的模型预测结果相对于不重复的情况下的模型预测结果一样 D.当两列特征高度相关时,无法用两列特征相同时所得到的结论来分析问题
多项选择题关于线性回归的描述,以下正确的有?()
A.基本假设包括随机干扰项是均值为0,方差为1的标准正态分布 B.基本假设包括随机干扰项是均值为0的同方差正态分布 C.在违背基本假设时,普通最小二乘法估计量不再是最佳线性无偏估计量 D.在违背基本假设时,模型不再可以估计
多项选择题关于可决系数R^2,下列说法中正确的是?()
A.可决系数R^2的定义为被回归方程已经解释的变差与总变差的比 B.0<=R^2<=1 C.可决系数R^2反映了样本回归线对样本观测值拟合优劣程度的一种描述 D.可决系数R^2的大小不受到回归模型中所包含的解释变量个数的影响
多项选择题C4.5算法继承了ID3算法的优点,并在以下哪几方面对ID3算法进行了改进?()
A.用信息增益率来选择属性 B.在树构造过程中进行剪枝 C.能够完成对连续属性的离散化处理 D.在树的构造过程中,不需要对数据集进行多次的顺序扫描和排序
多项选择题以下哪些算法,可以用神经网络去构造?()
A.KNN B.线性回归 C.逻辑回归 D.K-Means