A.姓名+手机号 B.日期+手机号 C.手机号+日期 D.手机号+姓名
多项选择题关于Streaming的容灾能力,下列说法正确的是?()
A.Supervisor进程退出后能够被Nimbus自动识别并拉起,不影响正在运行的业务 B.Worker异常退出后能够被Supervisor自动拉起,无需人工干预 C.节点故障时,该节点上的任务会被重分配到其他正常的节点,无需人工干预 D.Nimbus故障后,备Nimbus会自动接管,不影响正在运行的业务
判断题HBase过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配合使用。()
单项选择题在Spark中,假设lines是一个DStream对象,以下哪个语句可以周期统计这个流上的单词数?()
A.lines.flatMap(_.split”””)).map(word=>(word,1)).reduce(_+_).print() B.lines.flatMap(_.split”””)).map(word=>(word,word.length())).reduceByKey(_+_).print() C.lines.flatMap(_.split”””)).map(word=>(word,1)).reduceByKey(_+_).print() D.lines.flatMap(_.split”””)).flatMap(word=>(word,1)).groupByKey(_+_).print()
单项选择题在Fusioninsight HD集群中,Flume不支持将采集数据写入到集群中哪个服务?()
A.HDFS B.HBase C.Kafka D.Redis
多项选择题Spark应用程序有哪几种参数设置方法?()
A.在应用的配置文件Spark-defaults.conf中进行配置 B.在提交应用时,通过--conf 进行设置 C.在应用的代码里面,通过SparkContext的setProperty方法进行设置 D.在应用的代码里面,通过SparkerConf对象进行设置