单项选择题

A.filter（）B.groupByKey（）C.reduceByKey（）D.map（）在RDD的转换算子……

在RDD的转换算子中，用于将每个元素传递到函数func中，并将结果返回为一个新的数据集的转换算子是（）。

A.filter（）
B.groupByKey（）
C.reduceByKey（）
D.map（）

<上一题目录下一题>

热门试题

单项选择题下列选项，不属于集群管理器的有（）。

A.Hadoop Yarn
B.Apache Mesos
C.Local
D.Spark自带的独立调度器

单项选择题在RDD的转换算子中，主要用于（Key，Value）键值对的数据集，将具有相同Key的Value进行分组，会返回一个新的（Key，Iterable）形式的数据集的转换算子是（）。

A.filter（）
B.groupByKey（）
C.reduceByKey（）
D.map（）

单项选择题Spark与Hadoop在基于内存的运算中，说法正确的是（）。

A.Spark的运算效率是Hadoop的10倍
B.Spark的运算效率是Hadoop的100倍
C.Hadoop的运算效率是Spark的100倍
D.Hadoop的运算效率是Spark的10倍

单项选择题在Spark RDD中，划分Stage的依据是（）。

A.窄依赖
B.宽依赖
C.窄依赖和宽依赖
D.以上选项均错误

单项选择题如果一个有向图无法从任意顶点出发经过若干条边回到该点，则这个图就是（）

A.有向无环图
B.无环图
C.有向图
D.无向有环图