A.Flume B.Loader C.HBase D.MapReduoe
多项选择题在Solr建立索引时,下面哪些代码片段可以显著升建立索引性能?()
A.lbClient.setRequestWriter(newBinaryRequestWriter()) B.if(updateRequest.getDocumentsMap().size()>=10000){cloudSolrClient.r C.if(updateRequest.getDocuments().size()>=1000){cloudSolrClient.req D.SolrlnputDocumentdoc=new
单项选择题HBase表的rowkey设计是一个很重要的开发设计环节。假设存在如下场景,最频繁的查询场景是基于手机号查询每个月、每半年的历史通话记录,以下哪个rowkey设计是最优的?()
A.姓名+手机号 B.日期+手机号 C.手机号+日期 D.手机号+姓名
多项选择题关于Streaming的容灾能力,下列说法正确的是?()
A.Supervisor进程退出后能够被Nimbus自动识别并拉起,不影响正在运行的业务 B.Worker异常退出后能够被Supervisor自动拉起,无需人工干预 C.节点故障时,该节点上的任务会被重分配到其他正常的节点,无需人工干预 D.Nimbus故障后,备Nimbus会自动接管,不影响正在运行的业务
判断题HBase过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配合使用。()
单项选择题在Spark中,假设lines是一个DStream对象,以下哪个语句可以周期统计这个流上的单词数?()
A.lines.flatMap(_.split”””)).map(word=>(word,1)).reduce(_+_).print() B.lines.flatMap(_.split”””)).map(word=>(word,word.length())).reduceByKey(_+_).print() C.lines.flatMap(_.split”””)).map(word=>(word,1)).reduceByKey(_+_).print() D.lines.flatMap(_.split”””)).flatMap(word=>(word,1)).groupByKey(_+_).print()