A.jdkB.scalaC.pythonD.spark
多项选择题在spark中,以下选项,描述正确的有()。
A.一个应用程序,可能会有多个jobB.一个job,可能对应一个stageC.一个stage,可能会对应多个taskD.一个job,可能对应多个stage
多项选择题关于spark可视化程序,默认端口,描述正确的有()。
A.8080显示master运行情况B.4040可以看到job相关的信息C.8081显示的是worker运行的情况D.4040可以看到storage相关的信息
多项选择题Spark RDD持久化存储数据来源,有哪些?()
A.HDFSB.CassandraC.HbaseD.S3
多项选择题在Spark shell中,导入数据的过程,哪些是正确的?()
A.val rdd =sc.parallelize()B.val rdd =sc.textFile()C.val rddnew =rddold.map()D.val rddnew =rddold.filter()
多项选择题进入spark shell,可以传递哪些参数?()
A.--masterB.--driver-memoryC.--driver-coresD.--executor-cores
多项选择题在如下选项中,选出窄依赖项()。
A.mapB.flatmapC.unionD.distinct
多项选择题以下哪些操作为窄依赖?()
A.mapB.filterC.unionD.groupByKey
多项选择题在Spark中,对RDD的Action操作有()。
A.saveAsTextFileB.saveAsSequenceFileC.saveAsObjectFileD.saveAsParquet
多项选择题在Spark中,对RDD的Action操作包括()。
A.takeB.takeSampleC.foreachD.countByKey
多项选择题在Spark中,对RDD的Action操作有哪些?()
A.ReduceB.collectC.countD.first
多项选择题在Spark中,对RDD的transformation操作包括()。
A.flatmapB.sampleC.reduceByKeyD.reduce
多项选择题在Spark中,对RDD的transformation操作有哪些?()
A.mapB.unionC.joinD.distinct
多项选择题关于Spark RDD,说法正确的有哪些?()
A.RDD可以来源于持久存储,也可以从其他RDD转换B.RDD状态不可变,不能修改C.支持元素根据Key进行分区,保存到多个节点上D.可以设置存储级别(内存、磁盘等)来进行持久化
多项选择题Spark中RDD的数据来源有哪些?()
A.存储设备获取B.从其他RDD转换来C.从磁盘读取文件D.从hdfs读取数据
多项选择题Spark的运行模式包括()。
A.localB.StandaloneC.on Yarn or on mesosD.on Cloud