A.批处理B.交互处理C.流式计算D.事务处理
多项选择题spark和hadoop对比,说法正确的是()。
A.Hadoop中间结果会存储在磁盘上B.spark中间结果会存储在内存中C.Spark相对于hadoop提供了更多的操作D.Spark已经完全取代hadoop
多项选择题spark的数据,可以存储在哪些地方?()
A.HDFSB.CassandraC.HbaseD.S3
多项选择题Spark使用的资源管理器有哪些?()
A.MesosB.standaloneC.yarnD.cloud
多项选择题可以使用哪些语言来编写spark应用程序?()
A.javaB.scalaC.pythonD.R
多项选择题Spark架构中包括以下组件?()
A.Spark CoreB.Spark SQLC.Spark StreamingD.MLlibE.Graphx
多项选择题spark基本特点有哪些?()
A.Ease of useB.GeneralityC.Runs everywhereD.Speed
多项选择题下列对spark描述正确的有()。
A.spark是基于内存计算的B.spark处理大量数据的一个快速通用的引擎C.spark由AMPlab实验室开发D.spark目前是apache的顶级项目
多项选择题Spark是什么?()
A.Spark是基于内存计算的框架B.Spark是基于磁盘计算的框架C.Spark是一种基于RDD计算框架D.Spark是一种并行计算框架
多项选择题Spark与Hadoop的区别()。
A.Spark是基于内存计算框架,而Hadoop基于硬盘计算框架B.Spark是基于硬盘计算框架,而Hadoop基于内存计算框架C.Spark是一站式计算框架,而Hadoop只适合离线处理计算框架D.Spark只适合离线处理计算框架,而Hadoop是一站式计算框架
多项选择题Spark的容错机制是()。
A.checkpointB.persistC.cacheD.lineage
单项选择题DataSet和RDD的大小关系是?()
A.DataSet包含RDDB.RDD包含DataSetC.相互独立D.部分重合
单项选择题RDD和DataFrame的关系是? ()
A.RDD包含DataFrameB.DataFrame包含RDDC.相互独立D.部分重合
单项选择题DataSet和DataFrame的大小关系是? ()
A.DataSet包含DataFrameB.DataFrame包含DataSetC.相互独立D.部分重合
单项选择题DataFrame类似于关系型数据库中的什么概念? ()
A.列B.一行记录C.表D.数据库
单项选择题以下哪个版本是DataSet最先出现的版本? ()
A.Spark 1.3B.Spark 1.4C.Spark 1.5D.Spark 1.6