A.自动对文本进行分割 B.对分割后的每一个KV对应用用户定义的Map进行处理,生成新的KV对 C.对输出的结果集归拢、排序(系统自动完成) D.通过Reduce操作生成最后结果
多项选择题Mahout中实现的canopy聚类命令的可选参数是()
A.–input偏好数据路径 B.–output推荐结果路径 C.--t1(-t1)t1:T1阈值 D.--t2(-t2)t2:T2阈值
多项选择题Mahout中实现的kmeans聚类命令的必选参数是()
A.–input偏好数据路径 B.–output推荐结果路径 C.–clusters初始聚类中心点文件路径 D.--overwrite对输出路径进行重写
多项选择题基于内容的推荐算法生成推荐的过程主要依靠()
A.内容分析器 B.推荐系统 C.文件学习器 D.过滤部件
多项选择题下列对Sqoop描述正确的是()
A.Sqoop可以将数据从MySQL转储到HDFS上 B.Sqoop可以数据从HDFS转储到MySQL上 C.Sqoop可以将数据从Hbase转储到HDFS上 D.Sqoop可以数据从HDFS转储到Hbase上
多项选择题以下适用HDFS的场景有:()
A.超大文件处理 B.低延时的数据访问 C.使用廉价商用硬件 D.多用户写入,随机修改文件