A.--master=lcoalB.--class=lcoalC.--executor-memory=4GD.--master=root
单项选择题Spark中用于实时处理的组件是()。
A.Spark ShellB.Spark StreamingC.Spark SQLD.BlinkDB
单项选择题将RDD((’a’,1),(’b’,1))和RDD((’a’,1),(’d’,1))连接,得到RDD((’a’,1),(’b’,1,Some(None)),是以下哪种连接方法?()
A.fullOuterJionB.joinC.leftOuterJoinD.rightOuterJoin
单项选择题运行在Worker的Task执行器是()。
A.sparkcontextB.ExecutorC.DriverD.Worker
单项选择题spark中控制整个生命周期的是()。
A.sparkcontextB.taskC.DriverD.Worker
单项选择题使用union和join连接RDD((’a’,1),(’b’,1))和RDD((’a’,1),(’b’,1))的结果分别为哪项?()
A.都为((’a’,1),(’b’,1),(’a’,1),(’b’,1))B.都为((’a’,1),(’b’,1))C.union为((’a’,1),(’b’,1),(’a’,1),(’b’,1)),join为((’a’,(1,1)),(’b’,(1,1)))D.join为((’a’,1),(’b’,1),(’a’,1),(’b’,1)),union为((’a’,(1,1)),(’b’,(1,1)))
单项选择题下面哪种按键操作的方法返回值可以与输入类型不同?()
A.reduceByKeyB.combineByKeyC.sortByKeyD.groupByKey
单项选择题下面哪一组全部都是转化操作?()
A.map,take,reduceByKeyB.map,filter,collectC.map,zip,reduceBykeyD.join,map,take
多项选择题关于Spark streaming和storm描述正确的是?()
A.Storm逐条处理数据,而streaming有一定的时间窗口B.storm是亚秒级,而streaming有一定的延迟C.storm和streaming都是由scala开发D.streaming可以完全替代storm
多项选择题Spark Streaming的数据来源有哪些?()
A.KafkaB.FlumeC.HDFSD.Twitter/Kinesis
多项选择题Spark Streaming具有哪些特性?()
A.可伸缩B.高吞吐量C.容错D.实时流处理