判断题FusionInsightHD系统中HBase支持动态扩展列。
单项选择题Spark应用在运行时,Stage划分的依据是哪个?()
A.task B.taskSet C.action D.shuffle
判断题Spark是基于内存的计算,所有的Spark程序运行过程中的数据只能存储在内存中。
判断题FusionInsight HD用户管理系统仅支持管理人员。
判断题HDFS支持文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。
判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
判断题YARN上有两个同级队列Q1,Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。
单项选择题Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
A.迭代计算 B.离线计算 C.实时交互计算 D.流式计算
多项选择题关于大数据的主要特征理解和描述正确的有?()
A.来源多,格式多 B.增长速度快,处理速度快 C.存储量大,计算量大 D.数据的价值密度低
判断题FusionInsight HD中Loader作业提交到Yarn后,作业不能手工停止。
单项选择题Hadoop的HBaes不适合哪些数据类型的应用场景?()
A.大文件应用场景 B.海量数据应用场景 C.高吞吐率应用场景 D.半结构化数据应用场景
多项选择题基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储的组件有?()
A.MR B.Spark C.HDFS D.HBase
单项选择题FusionInsight HD系统中HDFS默认的Block Size是多少?()
A.32MB B.64MB C.128MB D.256MB
判断题Hadoop的NameNode用于存储文件系统的元数据。
多项选择题Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?()
A.大量小文件存储 B.高容错,高吞吐量 C.低延迟读取 D.流式数据访问