A.性别是数值型变量B.月收入是数值型变量C.年龄是数值型变量D.教育水平是数值型变量
多项选择题当前类中心是C1,C2,C3,C4,当前各类中包含的样本点数分别是n1,n2,n3,n4,K-均值聚类迭代时,关于样本点X的分配准则下述哪些说法是错误的?()
A.,则X分配到Ck代表的类中B.,则X分配到Ck代表的类中C.,则X分配到Ck代表的类中D.,则X分配到Ck代表的类中
多项选择题以下选项中哪些是对聚类分析结果的评价标准?()
A.所有类包含的样本个数越均匀越好B.同一类内距离越小越好C.每个类都有合乎背景的类别特征D.两个类之间距离越大越好
单项选择题对数据进行聚类分析的目的是什么?()
A.预测B.发现特征变量间的关系C.发现样本之间的某种共同特征D.都可以
单项选择题在层次聚类实施前,必须确定哪些度量?()
A.两集合间的距离的度量方式B.两点间的距离的度量方式和两集合间的距离的度量方式C.两点间的距离的度量方式D.都不需要
单项选择题影响k-均值聚类算法效果的主要因素之一是初始类心的选取,相比较而言,哪一种方法选取的k 个样本作为初始类心较好?()
A.按输入顺序选前k个B.选相距最远的k个C.随机挑选k个D.选分布密度最高处的k个