A.获取数据,并将原始数据转化成自己处理的数据对象 B.缓存数据,根据不同的可靠性策略,将数据保存在内存或文件上 C.输出数据到目的地,支持多种输出协议 D.拆分数据,根据数据的特性,将数据发送到不同的目的地
单项选择题在Fusionlnsight HD中,关于Hive的分区(partition)功能,如下叙述错误的是?()
A.分区字段要在创建表时定义 B.分区字段只能有一个,不可以创建多级分区 C.使用分区,可以减少某些查询的数据扫᧿范围,进而ᨀ高查询效率 D.分区字段可以作为where字句的条件
多项选择题下列关于HDFS客户端读文件过程正确的是?()
A.优先从最近的DataNode下载数据 B.文件数据先从DataNode返回至NameNode,然后从NameNode下致到客户端 C.如果客户端和所连接的DataNode在读取时出现故障,那么客户端会放弃这其他副本所在的节点 D.支持多个客户端同时从DataNode上读取同一个文件数据
单项选择题Spark应用的计算逻辑会被解析成DNG,这个解析操作由以下哪个功能模块完成?()
A.Client B.Application Master C.Executor D.Driver
多项选择题HDFS的应用开发中,下列哪些是HDFS服务支持的接口?()
A.BufferedOutputStream.write B.BufferedOutputStream.flush C.FileSystem.create D.FileSystem.append
单项选择题Fusionlnsight HD中,假设一个拓扑,设置了spout并发度为3,bolt1并发度为2,bolt2并发度为3,worker数目为2,那么bolt1的executor在worker中是如何分布的?()
A.两个worker中的其中一个worker分布两个 B.两个worker各分布一个 C.没有固定规律 D.两个worker都分布两个