A.分区 B.排序 C.组合 D.合并
多项选择题RDD的Transformation不包括以下哪些操作()。
A.map B.filter C.save D.count
多项选择题下列说法正确的是()。
A.非结构化数据包括图片、位置信息、网络日志、模型、文档以及关系数据库中的数据。 B.Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU等。 C.HDFS的写入流程中,客户端通过自有协议向各个DataNode写入数据。 D.ApacheSpark是一种基于内存的快速、通用、可扩展的大数据计算引擎。
多项选择题以下属于Hadoop的安装模式是()。
A.单机模式 B.伪分布式模式 C.多机模式 D.分布式模式
多项选择题下面关于Storm和Spark Streaming说法正确的是()。
A.Strom实时计算延迟度为毫秒级 B.Strom吞吐量高 C.SparkStreaming不支持且完善事务机制 D.SparkStreaming支持动态调整并行度
多项选择题消息传输保障通常有以下几种?()
A.最多一次 B.任意几次 C.最少一次 D.仅有一次
多项选择题Flink特点()。
A.流处理引擎 B.容错,可靠性 C.可扩展性,1000节点以上 D.低吞吐量,高延迟
多项选择题Loader特点()。
A.图形化 B.高性能 C.安全 D.实时更新
多项选择题Streaming与SparkStreaming的区别有哪些()。
A.SparkStreaming的吞吐量高于Streaming B.SparkStreaming实时性高于Streaming C.Streaming的事件实时处理 D.SparkStreaming的事件实时处理
多项选择题HBase适合具有如下需求的应用()。
A.海量数据 B.低吞吐量 C.能够同时处理结构化和非结构化数 D.需要良好的性能伸缩能力
多项选择题HDFS适合如下哪些工作()。
A.大文件的存储与访问 B.随机写入 C.流式数据访问 D.低延迟读取