A.Array(1,2,3,4,5,6,7,8,9,10) B.Array(1,3,5,7,9) C.Array(2,4,6,8,10) D.Array(1,10)
单项选择题val rdd=sc.parallelize(List(( Tom ,2),( Lee ,5),( Lee ,6),(“Tom”,7)))rdd.reduceByKey((x,y)=>x+y).collect上述代码的执行结果为()
A.Array((1,2),(3,10)) B.Array((9,“Tom”),(11,“Lee”)) C.Array((“Tom”,9),(“Lee”,11)) D.Array((“Tom”,2,7),(“Lee”,5,6))
单项选择题配置Standalone模式下的Spark集群,Worker节点需要在conf文件夹下的哪个文件中指明()
A.regionserver B.spark-env.sh C.spark-defaults.conf D.slaves
单项选择题MapReduce中的task是以()方式维护的
A.进程 B.线程 C.流水线 D.以上都不是
单项选择题Spark中的task分别是以()方式维护的
单项选择题使用Pig的优势在于()
A.Pig可以使用一个类SQL的语言,降低了学习成本 B.Pig的语言编辑器可以把类SQL语言转换为一系列经过优化处理的MapReduce运算 C.目前Pig主要由开源社区维护 D.Pig是一种数据流语言