单项选择题

sc是已创建的SparkContext实例，data是已创建的数组，使用data创建RDD的代码是（）

A.sc.fromArray（data）
B.sc.parallelize（data）
C.sc.copyFromArray（data）
D.sc.rdd（data）

<上一题目录下一题>

热门试题

单项选择题下列Spark算子中不会产生shuffle的算子是（）

A.map
B.distinct
C.groupByKey
D.reduceByKey

单项选择题Spark用于描述RDD依赖关系的模型是（）

A.DAG
B.DBG
C.DCG
D.DDG

单项选择题以下哪项不属于Spark SQL的关联类型（）

A.BroadcastJoin
B.ShuffledHashJoin
C.SortMergeJoin
D.StreamHashJoin

单项选择题下列哪项可作为spark.sql.orc.impl参数的值（）

A.arrow
B.orc1.5
C.native
D.orc1.6

单项选择题spark.sql.autoBroadcastJoinThreshold参数的默认值是（）

A.5MB
B.10MB
C.15MB
D.20MB