A.map B.flatMap C.reduceByKey D.sample
单项选择题Stage的Task的数量由什么决定()
A.Partition B.Job C.Stage D.TaskScheduler
单项选择题在Spark中,DAGScheduler的输出形式为()
A.DAG图 B.Stage C.TaskSet D.Task
单项选择题Spark Streaming中批处理时间间隔是指()
A.系统将获取到的数据流封装成一个RDD的时间间隔 B.系统对数据流进行统计分析的时间间隔 C.系统对数据流进行统计分析的频率 D.系统作业处理的周期
单项选择题下列哪个操作能够实现“基于窗口将DStream[(K,V)]中的值V按键K使用聚合函数func聚合得到新的DStream”()
A.count B.reduceByKeyAndWidow C.countByValue D.reduceByKey
单项选择题MLlib供的分布式矩阵中,不包含行、列索引信息的矩阵类型是()
A.RowMatrix B.IndexedRowMatrix C.Matrix D.CoordinateMatrix