单项选择题

持久化RDD的存储级别中，将RDD分区全部存储到磁盘上的存储级别是（）。

A.MEMORY_ONLY
B.MEMORY_AND_DISK
C.DISK_ONLY
D.MEMORY_ONLY_SER

<上一题目录下一题>

热门试题

单项选择题在RDD的转换算子中，用于将每个元素传递到函数func中，并将结果返回为一个新的数据集的转换算子是（）。

A.filter（）
B.groupByKey（）
C.reduceByKey（）
D.map（）

单项选择题下列选项，不属于集群管理器的有（）。

A.Hadoop Yarn
B.Apache Mesos
C.Local
D.Spark自带的独立调度器

单项选择题在RDD的转换算子中，主要用于（Key，Value）键值对的数据集，将具有相同Key的Value进行分组，会返回一个新的（Key，Iterable）形式的数据集的转换算子是（）。

A.filter（）
B.groupByKey（）
C.reduceByKey（）
D.map（）

单项选择题Spark与Hadoop在基于内存的运算中，说法正确的是（）。

A.Spark的运算效率是Hadoop的10倍
B.Spark的运算效率是Hadoop的100倍
C.Hadoop的运算效率是Spark的100倍
D.Hadoop的运算效率是Spark的10倍

单项选择题在Spark RDD中，划分Stage的依据是（）。

A.窄依赖
B.宽依赖
C.窄依赖和宽依赖
D.以上选项均错误