A.SparkCoreB.SparkStreamingC.SparkMlibD.SparkGraphX
单项选择题下列关于spark从kafka 获取数据描述错误的是()。
A.分为ReceiverAPI和DirectAPIB.使用ReceiverAPI可能会导致计算数据的节点内存溢出C.使用DirectAPI可以增加消费的并行度D.两种API都可以手动维护offset 保存位置
单项选择题下列不可以直接作为spatkStreaming数据源的是()。
A.RDD队列B.Kafka消息队列C.本地数据D.自定义socket数据源
单项选择题下列关于累加器描述不正确的是()。
A.实现所有分片处理时更新共享变量的功能。B.工作节点上的任务不能访问累加器的值。C.累加器是一个只读变量。D.累加器中的共享变量会发往每一个Executor。
单项选择题下列关于rdd分区描述错误的是()。
A.rangeB.range robinC.hashD.自定义
单项选择题下列关于spark的cache算子默认缓存机制描述错误的是()。
A.多次使用同一个RDD ,可以将该RDD缓存起来。B.缓存的计算结果,可以在后期得到重用。C.重用计算结果的前提是当前进程JVM不能停止工作。D.将数据持久化到硬盘,使用时再加载的策略。