A.Yarn-client适合测试,Yarn-cluster适合生产。 B.Yarn-client适合生产,Yarn-cluster适合测试。 C.Yarn-client任务提交节点宕机,整个任务会失败。Yarn-cluster不会。 D.Yarn-cluster任务提交节点宕机,整个任务会失败。Yarn-client不会。
多项选择题以下哪些场景是Spark应用场景?()
A.机器学 B.交互式分析 C.增量修改 D.流处理
多项选择题Spark具有以下哪些特性?()
A.代码量少 B.处理速度快 C.有不同层面的灵活性 D.巧妙借力现有大数据组件
多项选择题MapReduce基于Google发布的MapReduce论文设计开发,其具有如下哪些特点?()
A.易于编程 B.高速度 C.良好的扩展性 D.高容错性
多项选择题HDFS其除具备其它分布式文件系统相同特性外,还有自己特有的特性,以下哪些是他的特性()?
A.高容错性 B.高吞吐量 C.高随机性 D.大文件存储
多项选择题大数据的特征有以下哪个?()
A.体量巨大 B.处理速度快 C.类型繁多 D.价值密度低
判断题Spark和Hadoop都不使用于迭代计算。
多项选择题YARN容量调度器的主要特点有哪些?()
A.容量保证 B.灵活性 C.多重租赁 D.动态更新配置文件
单项选择题Hadoop中哪个模块负责HDFS的数据存储?()
A.NameNode B.DataNode C.ZooKeeper D.JobTraoker
单项选择题HBase的物理存储单元是什么? ()
A.Region B.ColumnFamily C.Column D.ROW
判断题Spark应用运行时,如果某个task运行失败则导致整个app运行失败。
判断题华为FusionInsightHD系统中,对存储的3个数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到到该节点。
单项选择题关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
A.Hive最终将数据存储在HDFS中 B.HiveSQL其本质是执行MapReduce任务 C.Hive是Hadoop平台的数据仓库工具 D.Hive对HBase有强依赖
单项选择题Spark组件中哪个选项不属于transformation操作?()
A.join B.distinct C.reduceByKey D.reduce
单项选择题FusionInsight HD系统中HDFS的Block默认保存几份?()
A.3份 B.2份 C.1份 D.不确定
单项选择题FusionInsight HD中的Loader实例必须与哪个实例部署在一起?()
A.DataNode B.RegionServer C.ResourceManager D.NodeManager