A.多次使用同一个RDD ,可以将该RDD缓存起来。B.缓存的计算结果,可以在后期得到重用。C.重用计算结果的前提是当前进程JVM不能停止工作。D.将数据持久化到硬盘,使用时再加载的策略。
单项选择题下列关于spark 的local模式描述错误的是()。
A.local[*]表示直接使用最大cpu核数。B.不需要启动master和worker守护进程。C.driver程序在应用程序结束后就会终止。D.SparkSubmit进程只充当客户提交任务的Client进程。
单项选择题以下不支持用来编写spark程序的语言是()。
A.JavaB.PythonC.ScalaD.C#
单项选择题下面哪个算子是Transformation算子?()
A.collectB.reduceC.reduceByKeyD.countByKey
单项选择题spark读取一个200M的文件,生成的RDD会有几个分区?()
A.1B.2C.3D.4
单项选择题对Spark中RDD的描述,错误的是:()。
A.RDD默认存储到内存中,内存不足时也会存储到磁盘中B.RDD表示一批元素的集合C.RDD中的数据是被分区的D.RDD中的数据不会丢失