A.Spark SQLB.Spark StreamingC.PySparkD.SparkC
单项选择题RDD的默认Storage Level是()
A.MEMORY_ONLYB.MEMORY_AND_DISKC.MEMORY_ONLY_SERD.MEMORY_AND_DISK_SER
单项选择题sc是已创建的SparkContext实例,data是已创建的数组,使用data创建RDD的代码是()
A.sc.fromArray(data)B.sc.parallelize(data)C.sc.copyFromArray(data)D.sc.rdd(data)
单项选择题下列Spark算子中不会产生shuffle的算子是()
A.mapB.distinctC.groupByKeyD.reduceByKey
单项选择题Spark用于描述RDD依赖关系的模型是()
A.DAGB.DBGC.DCGD.DDG
单项选择题以下哪项不属于Spark SQL的关联类型()
A.BroadcastJoinB.ShuffledHashJoinC.SortMergeJoinD.StreamHashJoin