A.大数据商业模式设计 B.商业场景全景规划 C.典型场景需求设计 D.场景分解和业务设计
单项选择题关于Hive见表基本操作,描述正确的是?()
A.创建外部表时需要指定external关键字 B.一旦表创建好,不可再修改表名 C.一旦表创建好,不可再修改列名 D.一旦表创建好,不可再增加新列
判断题Loader的作业执行失败,则此作业运行过程中导入的数据不会被删除,必须被手动删除。
判断题FusionInsight HD的Streaming对于ZooKeeper故障Streaming也可以正常提供服务。
判断题FusionInsightHD系统中HBase支持动态扩展列。
单项选择题Spark应用在运行时,Stage划分的依据是哪个?()
A.task B.taskSet C.action D.shuffle
判断题Spark是基于内存的计算,所有的Spark程序运行过程中的数据只能存储在内存中。
判断题FusionInsight HD用户管理系统仅支持管理人员。
判断题HDFS支持文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。
判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
判断题YARN上有两个同级队列Q1,Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。
单项选择题Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
A.迭代计算 B.离线计算 C.实时交互计算 D.流式计算
多项选择题关于大数据的主要特征理解和描述正确的有?()
A.来源多,格式多 B.增长速度快,处理速度快 C.存储量大,计算量大 D.数据的价值密度低
判断题FusionInsight HD中Loader作业提交到Yarn后,作业不能手工停止。
单项选择题Hadoop的HBaes不适合哪些数据类型的应用场景?()
A.大文件应用场景 B.海量数据应用场景 C.高吞吐率应用场景 D.半结构化数据应用场景
多项选择题基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储的组件有?()
A.MR B.Spark C.HDFS D.HBase