如下图所示,样本中有三个类别C1、C2、C3,采用KNN分类算法,图中给出了被测数据对象X和Y在特征空间中的映射点,以X、Y为中心的圆表示对应K个与X、Y最相近点的分布情况。依据KNN的多数表决规则,X归为C3类,Y归为C2类,但感觉这个分类结果与图示有些偏差,直观上X和Y都比较接近C1。你觉得可以采取哪些措施来改进算法以避免这种情况发生?()
A.X的问题是K值选择太小,可以适当增大K值,Y的问题是K值过大,可以适当减小K值
B.Y的分类问题可能是由于样本数不平衡造成,可以考虑压缩C2类别的样本数量
C.Y的问题可以考虑用加权多数表决法解决
D.X的问题可能是C3类含比较异常的样本,去除异常样本数据可以提高分类准确度