A.获取数据,并将原始数据转化成自己处理的数据对象 B.缓存数据,根据不同的可靠性策略,将数据保存在内存或文件上 C.输出数据到目的地,支持多种输出协议 D.拆分数据,根据数据的特性,将数据发送到不同的目的地
判断题向HBase集群中增加RegionServer主机时,必须先停止原集群,原因是HBase不支持动态扩容。()
单项选择题在Fusionlnsight HD中,关于Hive的分区(partition)功能,如下叙述错误的是?()
A.分区字段要在创建表时定义 B.分区字段只能有一个,不可以创建多级分区 C.使用分区,可以减少某些查询的数据扫᧿范围,进而ᨀ高查询效率 D.分区字段可以作为where字句的条件
判断题在Spark中,因为DataFrame是比RDD更上层的接口,调用层次会更多。因此,所有基于DataFrame开发的程序的性能会比基于RDD开发的程序的性能差。()
判断题在Fusionlnsight HD中,Spark默认采用YARN作为集群资源管理系统。()
多项选择题下列关于HDFS客户端读文件过程正确的是?()
A.优先从最近的DataNode下载数据 B.文件数据先从DataNode返回至NameNode,然后从NameNode下致到客户端 C.如果客户端和所连接的DataNode在读取时出现故障,那么客户端会放弃这其他副本所在的节点 D.支持多个客户端同时从DataNode上读取同一个文件数据