A.MEMORY_ONLYB.MEMORY_AND_DISKC.DISK_ONLYD.MEMORY_ONLY_SER
单项选择题在RDD的转换算子中,用于将每个元素传递到函数func中,并将结果返回为一个新的数据集的转换算子是()。
A.filter()B.groupByKey()C.reduceByKey()D.map()
单项选择题下列选项,不属于集群管理器的有()。
A.Hadoop YarnB.Apache MesosC.LocalD.Spark自带的独立调度器
单项选择题在RDD的转换算子中,主要用于(Key,Value)键值对的数据集,将具有相同Key的Value进行分组,会返回一个新的(Key,Iterable)形式的数据集的转换算子是()。
单项选择题Spark与Hadoop在基于内存的运算中,说法正确的是()。
A.Spark的运算效率是Hadoop的10倍B.Spark的运算效率是Hadoop的100倍C.Hadoop的运算效率是Spark的100倍D.Hadoop的运算效率是Spark的10倍
单项选择题在Spark RDD中,划分Stage的依据是()。
A.窄依赖B.宽依赖C.窄依赖和宽依赖D.以上选项均错误