A.超大文件处理 B.低延时的数据访问 C.使用廉价商用硬件 D.多用户写入,随机修改文件
多项选择题关于Hadoop单机模式和伪分布式模式的说法,错误的是:()
A.两者都起守护进程,且守护进程运行在一台机器上 B.单机模式不使用HDFS,但加载守护进程 C.两者都不与守护进程交互,避免复杂性 D.后者比前者增加了HDFS输入输出以及可检查内存使用情况
多项选择题使用Hbase的优势在于()
A.相对Hive,Hbase支持随机查询 B.使用HDFS文件系统,让Hbase存储的扩展几乎随着节点数的增加线性扩展 C.Hbase能够使用分布式计算,短时间内完成TB、PB级的数据搜索 D.Hbase数据库数据块大小和HDFS数据库块大小一致更好
多项选择题Mahout实现的聚类算法()
A.K-means B.Canopy C.模糊K-Means聚类 D.狄利克雷聚类
多项选择题按照远近程度来聚类需要明确两个距离()
A.点和点之间的距离 B.类和类之间的距离 C.欧式距离 D.兰氏距离
多项选择题下列哪些命令是Mahout中用于实现贝叶斯文本分类算法()
A.seqdirectory B.seq2sparse C.trainnb D.trainlogistic