判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
判断题YARN上有两个同级队列Q1,Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。
单项选择题Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
A.迭代计算 B.离线计算 C.实时交互计算 D.流式计算
多项选择题关于大数据的主要特征理解和描述正确的有?()
A.来源多,格式多 B.增长速度快,处理速度快 C.存储量大,计算量大 D.数据的价值密度低
判断题FusionInsight HD中Loader作业提交到Yarn后,作业不能手工停止。
单项选择题Hadoop的HBaes不适合哪些数据类型的应用场景?()
A.大文件应用场景 B.海量数据应用场景 C.高吞吐率应用场景 D.半结构化数据应用场景
多项选择题基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储的组件有?()
A.MR B.Spark C.HDFS D.HBase
单项选择题FusionInsight HD系统中HDFS默认的Block Size是多少?()
A.32MB B.64MB C.128MB D.256MB
判断题Hadoop的NameNode用于存储文件系统的元数据。
多项选择题Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?()
A.大量小文件存储 B.高容错,高吞吐量 C.低延迟读取 D.流式数据访问
判断题FusionInsightHD系统中一个集群可以管理多个服务,每个服务可以管理多个角色,每个角色只能管理一个实例。
判断题Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保存消息。
单项选择题通过FusionInsight Manager不能完成以下哪个操作?()
A.安装部署 B.性能监控 C.权限管理 D.虚拟机分配
多项选择题FusionInsight Manager会定时备份哪些数据?()
A.NameNode B.LDAP C.OMs D.DBService
多项选择题HBase集群定时执行Compaction的目的是什么?()
A.减少同一个Region,同一个ColumnFamily下的文件数目 B.提升数据读取性能 C.减少同一个ColumnFamily的文件数据 D.减少同一个Region的文件数目