多项选择题使用Fusionlnsight HD的Hive查询数据,当查询的中间结果数据量很大时,可以选择压缩中间结果数据来获取较好的性能。()
A.hive.exec.compress.intermediate B.hive.intermediate.compression.codec C.hive.exec.compress.output D.hive.intermediate.compression.type
单项选择题在Flume中,source功能模块的主要作用是?()
A.获取数据,并将原始数据转化成自己处理的数据对象 B.缓存数据,根据不同的可靠性策略,将数据保存在内存或文件上 C.输出数据到目的地,支持多种输出协议 D.拆分数据,根据数据的特性,将数据发送到不同的目的地
判断题向HBase集群中增加RegionServer主机时,必须先停止原集群,原因是HBase不支持动态扩容。()
单项选择题在Fusionlnsight HD中,关于Hive的分区(partition)功能,如下叙述错误的是?()
A.分区字段要在创建表时定义 B.分区字段只能有一个,不可以创建多级分区 C.使用分区,可以减少某些查询的数据扫᧿范围,进而ᨀ高查询效率 D.分区字段可以作为where字句的条件
判断题在Spark中,因为DataFrame是比RDD更上层的接口,调用层次会更多。因此,所有基于DataFrame开发的程序的性能会比基于RDD开发的程序的性能差。()