A.策略B.信息C.数据D.知识
单项选择题全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()
A.是指在第一个阶段先抽出一部分集群,然后在下一阶段选中的集群中,再抽出一部分集群,到最后阶段再抽取若干基本单元(最小单位)B.大规模抽样最多使用到两阶段抽样,因为误差无法控制C.抽样阶段每增加一级,其抽样误差不变,因此最终对总体的估计与简单抽样相同D.如果是全国性调查的多段集群抽样,其最小单元只能是行政区块村,不能是个人
单项选择题统计分析涉及高维运算,因此需要对高维空间中的数据结构进行探索,以发现其内部的模式,但高维探索特别困难,所以因子分析可以将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法错误的是()
A.因子分析与主成分分析都是数据降维的主要手段B.数据结构探索是因子分析功能之一C.降维是因子分析的功能之一D.因子分析在探索问题上,常用于效度分析
单项选择题在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
A.离差平方和法B.最短距离法C.最长距离法D.以上都不是
单项选择题问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类()
A.哥特曼(guttman)量表B.李克特5点测量量表C.李克特3点测量量表D.李克特9点测量量表
单项选择题回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种()
A.因子分析B.卡方分析C.方差分析D.相关分析