A.相对Hive,Hbase支持随机查询 B.使用HDFS文件系统,让Hbase存储的扩展几乎随着节点数的增加线性扩展 C.Hbase能够使用分布式计算,短时间内完成TB、PB级的数据搜索 D.Hbase数据库数据块大小和HDFS数据库块大小一致更好
多项选择题Mahout实现的聚类算法()
A.K-means B.Canopy C.模糊K-Means聚类 D.狄利克雷聚类
多项选择题按照远近程度来聚类需要明确两个距离()
A.点和点之间的距离 B.类和类之间的距离 C.欧式距离 D.兰氏距离
多项选择题下列哪些命令是Mahout中用于实现贝叶斯文本分类算法()
A.seqdirectory B.seq2sparse C.trainnb D.trainlogistic
多项选择题下列关于大数据的分析理念的说法中,正确的是()
A.在数据基础上倾向于全体数据而不是抽样数据 B.在分析方法上更注重相关分析而不是因果分析 C.在分析效果上更追究效率而不是绝对精确 D.在数据规模上强调相对数据而不是绝对数据
多项选择题数据清洗的方法包括()
A.缺失值处理 B.噪声数据清除 C.一致性检查 D.重复数据记录处理