A.必须对查询字段进行排序 B.必须对uniqueKey字段进行排序 C.第一次查询请求时,需指定查询参数,操作方法如下,solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAMCursorMarkParams.CURSOR_MARK_START) D.查询时,请求中不能带有start参数,Solr的返回结果中会有nextCursorMark,在下次调动使用这个值为oursorMark
单项选择题在Spark应用开发中,以下哪项的代码能正确进行单词统计?()
A.valcounts=textFile.map(line=>line.split(“”)).map(-rd=>(word,1)).reduceByKey(_+_) B.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).reduceByKey(_+_) C.valcounts=textFile.map(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_) D.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
单项选择题Fiume支持实时采集数据的source类型是哪项?()
A.taildir B.Log4j C.JMS D.Thrift
多项选择题Fusionlnsight HD关于Oozie的作业操作命令,下列哪几项叙述是正确的?()
A.submit命令可以让作业的状态变为PREP B.statr命令可以让PREP状态的作业变为RUNNING C.run命令可以让作业状态变为Running D.kill命令可以作用在PREP/SUSPEND/RUNNING状态的作业上
多项选择题Redis不适用与下面那些场景?()
A.复杂事物操作 B.计算器应用:例如统计某个网站的登录人数 C.一条消息被多个消费者同时消费且保证消息被所有订阅者成功消费的消息队 D.取最新N个数据:例如对某条微博,获取最新的10个评论
多项选择题关于Kafka的特点如下述正确的是?()
A.Kafka是一个高吞吐、分布式、基于发布订阅的消息系统 B.Kafka可以做到消息的持久化 C.Kafka适用于离线和在线的消息消费场景 D.Kafka可以保证每个Partion内的消息有序