A.网站用户行为数据存储 B.大规模数据批量离线计算 C.气象数据存储 D.生态系统数据存储
单项选择题HDFS适合做什么()。
A.流式数据访问 B.大量小文件存储 C.随机写入 D.低延迟读取
单项选择题下面不属于大数据核心的是()。
A.洞见本质 B.预测趋势 C.数据挖掘 D.指引未来
单项选择题下面关于ZooKeeper客户端使用命令,错误的是()。
A.创建节点:create/node B.列出节点:cat/node C.获取节点数据:get/node D.删除节点:delete/node
单项选择题Streaming的应用场景不包括下面哪种?()
A.实时分析 B.实时统计 C.实时推荐 D.实施监测
单项选择题关于MapReduce的描述,错误的是()。
A.易于编程 B.良好的扩展性 C.实时计算 D.高容错性
单项选择题哪个是HDFS(Hadoop Distributed File System)适合做的?()
A.大量小文件存储 B.流式数据访问 C.随机写入 D.低延迟读取
单项选择题以下不属于Hadoop的安装模式是()。
A.单机模式 B.多机模式 C.伪分布式模式 D.分布式模式
单项选择题HDFS不适合的功能有()。
A.多副本方式存储数据 B.储存TB-PB级别的数据 C.文件的随机写入 D.硬件故障的容错处理
单项选择题以下哪个组件不属于YARN()。
A.ResourceManager B.NodeManager C.ApplicationMaster D.Jobtracker
单项选择题spark是用以下哪种编程语言实现的()。
A.C语言 B.C++ C.java D.Scala
单项选择题大数据的最显著特征是()。
A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高
单项选择题下列有关RDD的说法中错误的是()。
A.RDD是一个只读的,可分区的分布式数据集。 B.RDD默认存储在磁盘,当磁盘不足时,溢写到内存。 C.RDD数据以分区的形式在集群中存储。 D.RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
单项选择题Map与Reduce之间的关系是()。
A.Map的输出=Reduce的输出 B.Map的输入=Reduce的输出 C.Map的输出=Reduce的输入 D.Map的输入=Reduce的输入
单项选择题HDFS中默认块的大小为()。
A.32MB B.64MB C.128MB D.128GB
单项选择题HDFS读取流程中,共读取()次。
A.1 B.2 C.3 D.4