A.递推公式有利于运算速度的提高B.进行聚类分析的变量必须进行标准化处理C.进行聚类分析的统计数据有关于类别描述的变量D.不同的类间距离会产生不同的递推公式
单项选择题在K-均值聚类进行前,必须确定哪些度量?()
A.如何度量任意两个样本点的距离B.不需要任何准备C.如何度量两个集合的距离D.同时确定如何度量样本点间的距离和两个集合的距离
多项选择题常用的相似系数有:()。
A.夹角余弦B.信息熵C.夹角正弦D.相关系数
多项选择题以下系统聚类方法中所用的相似性的度量,哪些没考虑变量间的相关性?()
A.B.C.D.
多项选择题假定要聚4类,K-均值算法的初始类中心如何确定?()
A.可以根据背景知识自行指定4个与样本点同维的向量做初始类中心B.可以随机生成4个与样本点同维的向量做初始类中心C.指定4个数做初始类中心D.随机生成4个数做初始类中心
单项选择题对30个10维样本进行层次聚类时,算法迭代几次结束?()
A.30B.29C.10D.9