多项选择题如果回归模型中存在多重共线性(multicollinearity),应该如何解决这一问题而不丢失太多信息?()
A.剔除所有的共线性变量 B.剔除共线性变量中的一个 C.通过计算方差膨胀因子(Variance Inflation Factor,VIF)来检查共线性程度,并采取相应措施 D.删除相关变量可能会有信息损失,可以不删除相关变量,而使用一些正则化方法来解决多重共线性问题,例如Ridge或Lasso回归
多项选择题逻辑回归与多元回归分析有哪些不同之处?()
A.逻辑回归是用来解决分类问题的,可以用于预测事件发生的概率。 B.为了测量真实样本与模型的拟合程度,可以使用逻辑回归来计算拟合优度指数。 C.在拟合逻辑回归模型之后,还可以根据系数值,来判断各个独立特征与目标输出的关系(正相关或负相关)。
判断题箱形图(Box Plot)是一种用作显示一组数据分散情况资料的统计图。
判断题One-vs-rest逻辑回归分类法中,假设有n个类别,那么就会建立n个二项分类器,每个分类器针对其中一个类别和剩余类别进行分类。进行预测时,利用这n个二项分类器进行分类,得到数据属于当前类的概率,选择其中概率最大的一个类别作为最终的预测结果。
判断题异常值(Outlier)指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值,也称异常数据,离群值。目前人们对异常值的判别与剔除主要采用物理判别法和统计判别法两种方法。