A.存储设备获取B.从其他RDD转换来C.从磁盘读取文件D.从hdfs读取数据
多项选择题Spark的运行模式包括()。
A.localB.StandaloneC.on Yarn or on mesosD.on Cloud
多项选择题以下对Spark SQL的描述正确的有()。
A.Spark SQL运行开发人员之间处理RDDB.Spark SQL可以直接查询hive中的数据C.Spark SQL运行开发人员之间使用SQL进行复制的数据分析D.Spark SQL的性能上,和Hive类似
多项选择题以下对Spark Core描述正确的有()。
A.引入了RDDB.移动计算而非移动数据C.使用线程池来减少task启动开销D.使用akka作为通讯框架
多项选择题大数据处理主要的三种场景为()。
A.批处理B.交互处理C.流式计算D.事务处理
多项选择题spark和hadoop对比,说法正确的是()。
A.Hadoop中间结果会存储在磁盘上B.spark中间结果会存储在内存中C.Spark相对于hadoop提供了更多的操作D.Spark已经完全取代hadoop
多项选择题spark的数据,可以存储在哪些地方?()
A.HDFSB.CassandraC.HbaseD.S3
多项选择题Spark使用的资源管理器有哪些?()
A.MesosB.standaloneC.yarnD.cloud
多项选择题可以使用哪些语言来编写spark应用程序?()
A.javaB.scalaC.pythonD.R
多项选择题Spark架构中包括以下组件?()
A.Spark CoreB.Spark SQLC.Spark StreamingD.MLlibE.Graphx
多项选择题spark基本特点有哪些?()
A.Ease of useB.GeneralityC.Runs everywhereD.Speed
多项选择题下列对spark描述正确的有()。
A.spark是基于内存计算的B.spark处理大量数据的一个快速通用的引擎C.spark由AMPlab实验室开发D.spark目前是apache的顶级项目
多项选择题Spark是什么?()
A.Spark是基于内存计算的框架B.Spark是基于磁盘计算的框架C.Spark是一种基于RDD计算框架D.Spark是一种并行计算框架
多项选择题Spark与Hadoop的区别()。
A.Spark是基于内存计算框架,而Hadoop基于硬盘计算框架B.Spark是基于硬盘计算框架,而Hadoop基于内存计算框架C.Spark是一站式计算框架,而Hadoop只适合离线处理计算框架D.Spark只适合离线处理计算框架,而Hadoop是一站式计算框架
多项选择题Spark的容错机制是()。
A.checkpointB.persistC.cacheD.lineage
单项选择题DataSet和RDD的大小关系是?()
A.DataSet包含RDDB.RDD包含DataSetC.相互独立D.部分重合