A.hadoop namenode-jar B.hadoop namenode-format C.hadoop datanode-jar D.hadoop datanode-format
单项选择题Standalone模式下配置Spark集群时,master节点的工作端口号需要在conf文件夹下的哪个文件指明()
A.regionserver B.spark-env.sh C.spark-defaults.conf D.slaves
单项选择题MLlib供的分布式矩阵中,既有行索引,又有列索引的是()
A.RowMatrix B.IndexedRowMatrix C.Matrix D.CoordinateMatrix
单项选择题spark的master和worker通过什么方式进行通信的?()
A.http B.nio C.netty D.Akka
单项选择题当HRegion中的StoreFile数目达到一定阈值时,就会触发HRegion的()
A.compact操作 B.split操作 C.flush操作 D.write操作
单项选择题对于SparkStreaming与Storm,系列叙述错误的是()
A.二者同为大数据流式数据处理框架 B.SparkStreaming在吞吐量与集成性方面要优于Storm C.SparkStreaming在数据处理的实时性要优于Storm D.SparkStreming又称为准实时处理框架,对数据的处理延迟能够达到秒级别