多项选择题

A.存储设备获取B.从其他RDD转换来C.从磁盘读取文件D.从hdfs读取数据Spark中RDD的数据来源有哪……

Spark中RDD的数据来源有哪些？（）

A.存储设备获取
B.从其他RDD转换来
C.从磁盘读取文件
D.从hdfs读取数据

<上一题目录下一题>

热门试题

多项选择题Spark的运行模式包括（）。

A.local
B.Standalone
C.on Yarn or on mesos
D.on Cloud

多项选择题以下对Spark SQL的描述正确的有（）。

A.Spark SQL运行开发人员之间处理RDD
B.Spark SQL可以直接查询hive中的数据
C.Spark SQL运行开发人员之间使用SQL进行复制的数据分析
D.Spark SQL的性能上，和Hive类似

多项选择题以下对Spark Core描述正确的有（）。

A.引入了RDD
B.移动计算而非移动数据
C.使用线程池来减少task启动开销
D.使用akka作为通讯框架

多项选择题大数据处理主要的三种场景为（）。

A.批处理
B.交互处理
C.流式计算
D.事务处理

多项选择题spark和hadoop对比，说法正确的是（）。

A.Hadoop中间结果会存储在磁盘上
B.spark中间结果会存储在内存中
C.Spark相对于hadoop提供了更多的操作
D.Spark已经完全取代hadoop

多项选择题spark的数据，可以存储在哪些地方？（）

A.HDFS
B.Cassandra
C.Hbase
D.S3

多项选择题Spark使用的资源管理器有哪些？（）

A.Mesos
B.standalone
C.yarn
D.cloud

多项选择题可以使用哪些语言来编写spark应用程序？（）

A.java
B.scala
C.python
D.R

多项选择题Spark架构中包括以下组件？（）

A.Spark Core
B.Spark SQL
C.Spark Streaming
D.MLlib
E.Graphx

多项选择题spark基本特点有哪些？（）

A.Ease of use
B.Generality
C.Runs everywhere
D.Speed

多项选择题下列对spark描述正确的有（）。

A.spark是基于内存计算的
B.spark处理大量数据的一个快速通用的引擎
C.spark由AMPlab实验室开发
D.spark目前是apache的顶级项目

多项选择题Spark是什么？（）

A.Spark是基于内存计算的框架
B.Spark是基于磁盘计算的框架
C.Spark是一种基于RDD计算框架
D.Spark是一种并行计算框架

多项选择题Spark与Hadoop的区别（）。

A.Spark是基于内存计算框架，而Hadoop基于硬盘计算框架
B.Spark是基于硬盘计算框架，而Hadoop基于内存计算框架
C.Spark是一站式计算框架，而Hadoop只适合离线处理计算框架
D.Spark只适合离线处理计算框架，而Hadoop是一站式计算框架

多项选择题Spark的容错机制是（）。

A.checkpoint
B.persist
C.cache
D.lineage

单项选择题DataSet和RDD的大小关系是？（）

A.DataSet包含RDD
B.RDD包含DataSet
C.相互独立
D.部分重合