A.K_MEANS_PARALLEL B.KMeansModel类实例 C.kmeans.epsilon D.kmeans.test实例
单项选择题Mahout中进行大数据分析时,需要对数据进行聚类,其所使用的命令是()
A.seq2sparse B.kmeans C.trainnb D.testnb
单项选择题SPARK默认的存储级别是()
A.MEMORY_ONLY B.MEMORY_ONLY_SER C.MEMORY_AND_DISK D.MEMORY_AND_DISK_SER
单项选择题以下对Spark中Work的主要工作描述错误的是()
A.管理当前节点内存 B.不会运行业务逻辑代码 C.会运行业务逻辑代码 D.接收master分配过来的资源指令
单项选择题以下关于SPARK中的spark context,描述错误的是:()
A.控制整个application的生命周期 B.可以控制dagsheduler组件 C.可以控制taskscheduler组件 D.SparkContext为Spark的主要入口点
单项选择题HDFS有一个gzip文件大小75MB,客户端设置Block大小为64M。当运行MapReduce任务读取该文件时input split大小为多少()
A.64M B.75M C.一个map读取64M,另外一个map读取11M D.一个map读取11M,另外一个map读取64M