A.Partition B.Job C.Stage D.TaskScheduler
单项选择题在Spark中,DAGScheduler的输出形式为()
A.DAG图 B.Stage C.TaskSet D.Task
单项选择题Spark Streaming中批处理时间间隔是指()
A.系统将获取到的数据流封装成一个RDD的时间间隔 B.系统对数据流进行统计分析的时间间隔 C.系统对数据流进行统计分析的频率 D.系统作业处理的周期
单项选择题下列哪个操作能够实现“基于窗口将DStream[(K,V)]中的值V按键K使用聚合函数func聚合得到新的DStream”()
A.count B.reduceByKeyAndWidow C.countByValue D.reduceByKey
单项选择题MLlib供的分布式矩阵中,不包含行、列索引信息的矩阵类型是()
A.RowMatrix B.IndexedRowMatrix C.Matrix D.CoordinateMatrix
单项选择题MLlib中创建稀疏矩阵((0.0,2.0),(3.0,0.0),(0.0,6.0))的语句是()
A.val dm:Matrix=Matrices.dense(3,2,Array(0.0,3.0,0.0,2.0,0.0,6.0)) B.val dm:Matrix=Matrices.sparse(3,2,Array(0.0,2.0,3.0,0.0,0.0,6.0)) C.val sm:Matrix=Matrices.sparse(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6)) D.val sm:Matrix=Matrices.dense(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6))