A.map B.filter C.save D.count
多项选择题下列说法正确的是()。
A.非结构化数据包括图片、位置信息、网络日志、模型、文档以及关系数据库中的数据。 B.Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU等。 C.HDFS的写入流程中,客户端通过自有协议向各个DataNode写入数据。 D.ApacheSpark是一种基于内存的快速、通用、可扩展的大数据计算引擎。
多项选择题以下属于Hadoop的安装模式是()。
A.单机模式 B.伪分布式模式 C.多机模式 D.分布式模式
多项选择题下面关于Storm和Spark Streaming说法正确的是()。
A.Strom实时计算延迟度为毫秒级 B.Strom吞吐量高 C.SparkStreaming不支持且完善事务机制 D.SparkStreaming支持动态调整并行度
多项选择题消息传输保障通常有以下几种?()
A.最多一次 B.任意几次 C.最少一次 D.仅有一次
多项选择题Flink特点()。
A.流处理引擎 B.容错,可靠性 C.可扩展性,1000节点以上 D.低吞吐量,高延迟