A.预测一位新的顾客是否会在一家百货公司消费100元以上B.使用数据库管理系统查找个别的记录C.通过因特网的搜索引擎查找特定的Web页面D.银行预测一位贷款客户是否会发生违约
单项选择题KPCA成为核主成分分析,核主成分分析解决了PCA存在的什么问题()
A.PCA的最大化方差理论有时候不适用B.PCA是一种线性降维方法,无法挖掘非线性关系C.核主成分分析更加复杂因此效果更好D.核主成分分析中的特征值计算更加快速
单项选择题使用带L1惩罚项的逻辑回归模型进行特征选择,以下选择中错误的是()
A.L1惩罚项的逻辑回归模型倾向于筛选出比较少的特征B.L1惩罚项降维的原理在于保留多个对目标值具有同等相关性的特征中的一个C.相比较树模型,L1惩罚项的逻辑回归选择出的特征不具有线性相关性D.是嵌入法中的一种
单项选择题以下关于递归特征消除法的描述中错误的是()
A.递归消除特征法使用一个基模型来进行多轮训练,每轮训练后,消除若干权值系数的特征,再基于新的特征集进行下一轮训练B.RFE的稳定性很大程度上取决于迭代时底层用的哪种模型C.递归特征消除法就是对所有特征进行遍历删除不符合条件的,保留符合条件的D.如果在迭代时使用未正则化的LR模型,那么递归特征消除法也是不稳定的
单项选择题卡方检验是检验定性自变量对定性因变量的相关性,卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,以下关于卡方检验的描述中错误的是()
A.实际观测值与理论推断值之间的偏离程度就决定卡方值的大小B.卡方值越大,说明实际观测值和理论推断之偏差程度越大C.卡方检验是一种假设检验D.卡方检验主要针对连续变量
单项选择题在关键词的撷取中为什么要引入逆向文本频率idf ()
A.在越多的文章中出现过,说明重要性越高,则进行加权B.在越多的文章中出现过的次数越多,说明对我们的分析和统计没什么帮助,利用该数值进行降权C.一个词在一篇文章中出现的次数越多,说明越重要,利用该指数进行加权D.一个词如果是常用词,则统计时说明很重要,进行加权