A.spark是基于内存计算的B.spark处理大量数据的一个快速通用的引擎C.spark由AMPlab实验室开发D.spark目前是apache的顶级项目
多项选择题Spark是什么?()
A.Spark是基于内存计算的框架B.Spark是基于磁盘计算的框架C.Spark是一种基于RDD计算框架D.Spark是一种并行计算框架
多项选择题Spark与Hadoop的区别()。
A.Spark是基于内存计算框架,而Hadoop基于硬盘计算框架B.Spark是基于硬盘计算框架,而Hadoop基于内存计算框架C.Spark是一站式计算框架,而Hadoop只适合离线处理计算框架D.Spark只适合离线处理计算框架,而Hadoop是一站式计算框架
多项选择题Spark的容错机制是()。
A.checkpointB.persistC.cacheD.lineage
单项选择题DataSet和RDD的大小关系是?()
A.DataSet包含RDDB.RDD包含DataSetC.相互独立D.部分重合
单项选择题RDD和DataFrame的关系是? ()
A.RDD包含DataFrameB.DataFrame包含RDDC.相互独立D.部分重合
单项选择题DataSet和DataFrame的大小关系是? ()
A.DataSet包含DataFrameB.DataFrame包含DataSetC.相互独立D.部分重合
单项选择题DataFrame类似于关系型数据库中的什么概念? ()
A.列B.一行记录C.表D.数据库
单项选择题以下哪个版本是DataSet最先出现的版本? ()
A.Spark 1.3B.Spark 1.4C.Spark 1.5D.Spark 1.6
单项选择题RDD最开始出现的版本是? ()
A.Spark 1.0B.Spark 1.1C.Spark 1.2D.Spark 1.3
单项选择题DataFrame最开始出现的版本是? ()
多项选择题Spark SQL的特点有哪些?()
A.复杂性B.效率高C.基于内存D.高兼容
单项选择题Spark SQL是转换成什么来执行的? ()
A.MapReduceB.JDBCC.RDDD.以上都不是
多项选择题Spark能读写的文件有哪些类型? ()
A.JSONB.CSVC.SequenceD.对象文件
单项选择题在读取文件中,如果读取文件夹,被看成RDD的是什么? ()
A.每一个文件B.子文件夹C.整个文件夹D.看情况而定
单项选择题在读取文件过程变成RDD过程中,元素是指文件的什么? ()
A.整个文件内容B.文件的一行C.文件的一段D.文件中特定符号