单项选择题

A.RDD包含DataFrameB.DataFrame包含RDDC.相互独立D.部分重合RDD和DataFra……

RDD和DataFrame的关系是？（）

A.RDD包含DataFrame
B.DataFrame包含RDD
C.相互独立
D.部分重合

<上一题目录下一题>

热门试题

单项选择题DataSet和DataFrame的大小关系是？（）

A.DataSet包含DataFrame
B.DataFrame包含DataSet
C.相互独立
D.部分重合

单项选择题DataFrame类似于关系型数据库中的什么概念？（）

A.列
B.一行记录
C.表
D.数据库

单项选择题以下哪个版本是DataSet最先出现的版本？（）

A.Spark 1.3
B.Spark 1.4
C.Spark 1.5
D.Spark 1.6

单项选择题RDD最开始出现的版本是？（）

A.Spark 1.0
B.Spark 1.1
C.Spark 1.2
D.Spark 1.3

单项选择题DataFrame最开始出现的版本是？（）

A.Spark 1.0
B.Spark 1.1
C.Spark 1.2
D.Spark 1.3

多项选择题Spark SQL的特点有哪些？（）

A.复杂性
B.效率高
C.基于内存
D.高兼容

单项选择题Spark SQL是转换成什么来执行的？（）

A.MapReduce
B.JDBC
C.RDD
D.以上都不是

多项选择题Spark能读写的文件有哪些类型？（）

A.JSON
B.CSV
C.Sequence
D.对象文件

单项选择题在读取文件中，如果读取文件夹，被看成RDD的是什么？（）

A.每一个文件
B.子文件夹
C.整个文件夹
D.看情况而定

单项选择题在读取文件过程变成RDD过程中，元素是指文件的什么？（）

A.整个文件内容
B.文件的一行
C.文件的一段
D.文件中特定符号

单项选择题使用collectAsMap（）时如果key对应多个value，会如何处理？（）

A.保留第一个value
B.保留最后一个value
C.保留所有value的值
D.保留所有value的值构成的集合

多项选择题下列哪些操作会将pair RDD的数据量减少一半（）

A.rdd.keys
B.rdd.sortByKey（）
C.rdd.mapValues（x=>x+1）
D.rdd.values

单项选择题当缓存丢失时，RDD如何处理？（）

A.全部数据重头计算
B.从不计算丢失数据
C.计算一部分丢失数据
D.计算全部丢失数据

多项选择题下列RDD缓存级别中哪些CPU时间较高？（）

A.MEMORY_ONLY
B.MEMORY_ONLY_SER
C.MEMORY_ONLY_DISK
D.MEMEORY_ONLY_DISK_SER

多项选择题在RDD缓存级别中哪些有部分需要磁盘上？（）

A.MEMORY_ONLY
B.MEMORY_ONLY_SER
C.MEMORY_ONLY_DISK
D.MEMEORY_ONLY_DISK_SER