A.Supervisor进程退出后能够被Nimbus自动识别并拉起,不影响正在运行的业务 B.Worker异常退出后能够被Supervisor自动拉起,无需人工干预 C.节点故障时,该节点上的任务会被重分配到其他正常的节点,无需人工干预 D.Nimbus故障后,备Nimbus会自动接管,不影响正在运行的业务
单项选择题在Spark中,假设lines是一个DStream对象,以下哪个语句可以周期统计这个流上的单词数?()
A.lines.flatMap(_.split”””)).map(word=>(word,1)).reduce(_+_).print() B.lines.flatMap(_.split”””)).map(word=>(word,word.length())).reduceByKey(_+_).print() C.lines.flatMap(_.split”””)).map(word=>(word,1)).reduceByKey(_+_).print() D.lines.flatMap(_.split”””)).flatMap(word=>(word,1)).groupByKey(_+_).print()
单项选择题在Fusioninsight HD集群中,Flume不支持将采集数据写入到集群中哪个服务?()
A.HDFS B.HBase C.Kafka D.Redis
多项选择题Spark应用程序有哪几种参数设置方法?()
A.在应用的配置文件Spark-defaults.conf中进行配置 B.在提交应用时,通过--conf 进行设置 C.在应用的代码里面,通过SparkContext的setProperty方法进行设置 D.在应用的代码里面,通过SparkerConf对象进行设置
单项选择题在FusionInsight HD产品中,Kafka服务的角色名称是?()
A.Producer B.Broker C.Consumer D.ZooKeeper
多项选择题FusionInsight HD中,关于Hive UDF二次开发,如下叙述正确的是?()
A.用户自定义的UDF在被使用之前,需要先在Hive系统中创建UD只 B.用户自定义的UDF,不允许加入汇总和状态等信息 C.用户自定义的UDF,可以根据实际情况添加deterministic和statefull D.安全集群下,用户自定义的UDF,建议在每次使用前都创建一次