A.所有类包含的样本个数越均匀越好B.同一类内距离越小越好C.每个类都有合乎背景的类别特征D.两个类之间距离越大越好
单项选择题对数据进行聚类分析的目的是什么?()
A.预测B.发现特征变量间的关系C.发现样本之间的某种共同特征D.都可以
单项选择题在层次聚类实施前,必须确定哪些度量?()
A.两集合间的距离的度量方式B.两点间的距离的度量方式和两集合间的距离的度量方式C.两点间的距离的度量方式D.都不需要
单项选择题影响k-均值聚类算法效果的主要因素之一是初始类心的选取,相比较而言,哪一种方法选取的k 个样本作为初始类心较好?()
A.按输入顺序选前k个B.选相距最远的k个C.随机挑选k个D.选分布密度最高处的k个
单项选择题我国30个省市自治区的高等教育发展水平存在一定差异,收集与高等教育发展水平相关的统计指标,如生均教育经费,百万人口高等院校数等10个指标。现用聚类分析研究各地区普通教育发展状况的差异与特点。这30个地区应分成几类?()
A.华南、华北、华中三类B.通过数据分析试验确定C.发展层度低、中、高三类D.东部,西部两类
多项选择题下列协方差矩阵的说法哪些是正确的?()
A.对标准化数据而言,协方差矩阵所有特征值的和等于变量的个数B.对于一般数据而言,协方差矩阵对角元素的和等于所有特征值的和C.对标准化数据而言,协方差矩阵所有特征值的和不等于变量的个数D.对于一般数据而言,协方差矩阵对角元素的和不等于所有特征值的和