单项选择题

在RDD的转换算子中，主要用于（Key，Value）键值对的数据集，将具有相同Key的Value进行分组，会返回一个新的（Key，Iterable）形式的数据集的转换算子是（）。

A.filter（）
B.groupByKey（）
C.reduceByKey（）
D.map（）

<上一题目录下一题>

热门试题

单项选择题Spark与Hadoop在基于内存的运算中，说法正确的是（）。

A.Spark的运算效率是Hadoop的10倍
B.Spark的运算效率是Hadoop的100倍
C.Hadoop的运算效率是Spark的100倍
D.Hadoop的运算效率是Spark的10倍

单项选择题在Spark RDD中，划分Stage的依据是（）。

A.窄依赖
B.宽依赖
C.窄依赖和宽依赖
D.以上选项均错误

单项选择题如果一个有向图无法从任意顶点出发经过若干条边回到该点，则这个图就是（）

A.有向无环图
B.无环图
C.有向图
D.无向有环图

单项选择题在RDD的行动算子中，用于用于返回数组的第一个元素的行动算子是（）。

A.first（）
B.count（）
C.take（n）
D.reduce（）

单项选择题下列选项中，可以支持Scala和Python编程的交互式解释器是（）。

A.HBase-Shell
B.Spark-Shell
C.Hadoop-Shell
D.Hive-Shell