A.可决系数R^2的定义为被回归方程已经解释的变差与总变差的比 B.0<=R^2<=1 C.可决系数R^2反映了样本回归线对样本观测值拟合优劣程度的一种描述 D.可决系数R^2的大小不受到回归模型中所包含的解释变量个数的影响
多项选择题C4.5算法继承了ID3算法的优点,并在以下哪几方面对ID3算法进行了改进?()
A.用信息增益率来选择属性 B.在树构造过程中进行剪枝 C.能够完成对连续属性的离散化处理 D.在树的构造过程中,不需要对数据集进行多次的顺序扫描和排序
多项选择题以下哪些算法,可以用神经网络去构造?()
A.KNN B.线性回归 C.逻辑回归 D.K-Means
多项选择题逻辑回归和SVM的联系与区别,正确的是?()
A.二者都可以处理分类问题 B.二者都可以增加不同的正则化项 C.二者都是参数模型 D.SVM的处理方法是只考虑supportvectors,也就是和分类最相关的少数点,去学习分类器
多项选择题对于一个多分类模型,可以如何选择训练集?()
A.有放回简单随机抽样 B.无放回简单随机抽样 C.分层抽样 D.整群抽样
多项选择题如果整个数据分析模型完成后,发现效果不良,考虑从哪些步骤入手改进?()
A.数据清洗是否到位 B.数据理解是否有偏差 C.模型选择是否合适 D.参数调整是否合理