A.collectB.reduceC.reduceByKeyD.countByKey
单项选择题spark读取一个200M的文件,生成的RDD会有几个分区?()
A.1B.2C.3D.4
单项选择题对Spark中RDD的描述,错误的是:()。
A.RDD默认存储到内存中,内存不足时也会存储到磁盘中B.RDD表示一批元素的集合C.RDD中的数据是被分区的D.RDD中的数据不会丢失
单项选择题spark的master和worker的作用错误的是?()
A.master负责分配jobB.worker执行jobC.spark的计算是在内存中进行D.spark的计算是在硬盘中进行
单项选择题哪个不是kafka的组件?()
A.生产者B.消费者C.reduceByKeyD.kafka集群
单项选择题flume的作用?()
A.从日志中读取数据B.从mysql读取数据C.从Oracle读取数据D.从sqlserver读取数据