单项选择题在Fusionlnsight HD中,关于Hive的分区(partition)功能,如下叙述错误的是?()
A.分区字段要在创建表时定义 B.分区字段只能有一个,不可以创建多级分区 C.使用分区,可以减少某些查询的数据扫᧿范围,进而ᨀ高查询效率 D.分区字段可以作为where字句的条件
判断题在Spark中,因为DataFrame是比RDD更上层的接口,调用层次会更多。因此,所有基于DataFrame开发的程序的性能会比基于RDD开发的程序的性能差。()
判断题在Fusionlnsight HD中,Spark默认采用YARN作为集群资源管理系统。()
多项选择题下列关于HDFS客户端读文件过程正确的是?()
A.优先从最近的DataNode下载数据 B.文件数据先从DataNode返回至NameNode,然后从NameNode下致到客户端 C.如果客户端和所连接的DataNode在读取时出现故障,那么客户端会放弃这其他副本所在的节点 D.支持多个客户端同时从DataNode上读取同一个文件数据
判断题Spark Streaming作为微批处理的流处理引擎,是将每个时间分片的数据转换为一个RDD中的一个分区进行计算。()