A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B.要求同类数据的内容相似度尽可能小 C.要求不同类数据的内容相似度尽可能小 D.与分类挖掘技术相似的是,都是要对数据进行分类处理
多项选择题Namenode在启动时自动进入安全模式,在安全模式阶段,说法正确的是:()
A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性 B.根据策略对数据块进行必要的复制或删除 C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式 D.文件系统允许有修改
多项选择题spark的有几种部署模式()
A.本地模式 B.standalone模式 C.spark on yarn模式 D.mesos模式
多项选择题下列关于舍恩伯格对大数据特点的说法中,正确的是?()
A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高
多项选择题HFile数据格式中的KeyValue数据格式,下列选项描述正确的是?()
A.是byte[]数组 B.没有固定的结构 C.数据的大小是定长的 D.有固定的结构
多项选择题下面对LSM结构描述正确的是?()
A.顺序存储 B.直接写硬盘 C.需要将数据Flush到磁盘 D.是一种搜索平衡树