A.Ease of useB.GeneralityC.Runs everywhereD.Speed
多项选择题下列对spark描述正确的有()。
A.spark是基于内存计算的B.spark处理大量数据的一个快速通用的引擎C.spark由AMPlab实验室开发D.spark目前是apache的顶级项目
多项选择题Spark是什么?()
A.Spark是基于内存计算的框架B.Spark是基于磁盘计算的框架C.Spark是一种基于RDD计算框架D.Spark是一种并行计算框架
多项选择题Spark与Hadoop的区别()。
A.Spark是基于内存计算框架,而Hadoop基于硬盘计算框架B.Spark是基于硬盘计算框架,而Hadoop基于内存计算框架C.Spark是一站式计算框架,而Hadoop只适合离线处理计算框架D.Spark只适合离线处理计算框架,而Hadoop是一站式计算框架
多项选择题Spark的容错机制是()。
A.checkpointB.persistC.cacheD.lineage
单项选择题DataSet和RDD的大小关系是?()
A.DataSet包含RDDB.RDD包含DataSetC.相互独立D.部分重合
单项选择题RDD和DataFrame的关系是? ()
A.RDD包含DataFrameB.DataFrame包含RDDC.相互独立D.部分重合
单项选择题DataSet和DataFrame的大小关系是? ()
A.DataSet包含DataFrameB.DataFrame包含DataSetC.相互独立D.部分重合
单项选择题DataFrame类似于关系型数据库中的什么概念? ()
A.列B.一行记录C.表D.数据库
单项选择题以下哪个版本是DataSet最先出现的版本? ()
A.Spark 1.3B.Spark 1.4C.Spark 1.5D.Spark 1.6
单项选择题RDD最开始出现的版本是? ()
A.Spark 1.0B.Spark 1.1C.Spark 1.2D.Spark 1.3