A.王公/子/说/的确/实在/理B.王/公子/说/的/确实/在理C.王公子/说/的/确实/在理D.王公子/说的/确实/在理
单项选择题在MNIST数据集中包含了从0-9数字的手写体图像,初始图像是28像素*28像素,我们希望构建预测模型预测图像中的数字,请问选项中不是PCA转换计算流程的步骤是()
A.样本集标准化B.样本集矩阵中心化C.计算样本矩阵的协方差矩阵CD.求样本集矩阵的协方差矩阵的特征值和特征向量
单项选择题在MNIST数据集中包含了从0-9数字的手写体图像,初始图像是28像素*28像素,我们希望构建预测模型预测图像中的数字,如果想要对图像进行降维,这里我们使用PCA对图像维度进行压缩,PCA是以什么来判断某一个坐标轴当中信息量的多少()
A.均值B.方差C.变异系数D.四分位差
单项选择题我们有一个来自于大众点评的数据,数据集保存了用户对商家的点评数据,每个商家都有一个点评数量,假设我们的任务是使用协同过滤方法预测某用户给某商家的打分,点评数量会是一个非常有用的特征,因为人气和高评分之间有很强的相关性。现在我们将点评数量的分布绘制出来,如图所示,在这个分布中,数量的否是不是很均衡,如果我们想要让离散化后的每个分箱中的数量接近,应该使用的分箱方法是()
A.对数分箱B.人工分箱C.等深分箱D.等宽分箱
单项选择题我们有一个来自于大众点评的数据,数据集保存了用户对商家的点评数据,每个商家都有一个点评数量,假设我们的任务是使用协同过滤方法预测某用户给某商家的打分,点评数量会是一个非常有用的特征,因为人气和高评分之间有很强的相关性。现在我们将点评数量的分布绘制出来,如图所示,根据点评数量数据分布,需要对数据进行离散化,请问该数据需要离散化的原因是()
A.数据过于集中在较小的部分B.数据存在明显的离群值C.数据不符合正态分布D.数据的分布不连续
多项选择题下列关于决策树分类算法的说正确的是()
A.树长的太高容易过拟合B.树长的太高容易欠拟合C.可以通过剪枝限制过拟合D.可解释性强