A.SparkCore B.SparkSQL C.SparkStreaming D.SparkStructuredStreaming
单项选择题下面关于HDFS不适合做的事,不正确的是()。
A.大量小文件存储 B.随机写入 C.低文件读取 D.流式数据访问
单项选择题下列关于大数据的介绍正确的是()。
A.一次建模终生受益 B.无目的地发现知识 C.替代有效的商业模式 D.不能替代专家的作用
单项选择题下面不属于大数据4V特征的是()。
A.Volume B.Value C.Variety D.Virtual
单项选择题MapReduce的特点有哪些()。
A.易于编程 B.良好的扩展性 C.高容错性 D.以上都是
单项选择题下面不属于HDFS系统架构的是()。
A.NameNode B.DataNode C.Client D.Blockops
单项选择题HDFS除具备其它分布式文件系统相同特性外,特有的特性是()。
A.高容错性 B.高吞吐量 C.大文件存储 D.以上都是
单项选择题HBase的最小存储单元是什么?()
A.RegionB.ColumnFamilyC.ColumnD.Cell
单项选择题下面哪点不是容量调度器的特点?()
A.容量保证 B.灵活性 C.容错 D.动态更新配置文件
单项选择题下面关于Hadoop兼容性错误的是()。
A.Flink能够支持Yarn,能够从HDFS和HBase中获取数据 B.能够使用所有的Hadoop的格式化输入和输出 C.能够使用Hadoop原有的Mappers和Reducers,但不能与Flink的操作混合使用 D.能够更快的运行Hadoop的作业
单项选择题下面哪个场景不适合HBase的应用()。
A.需要完全拥有传统关系型数据库所具备的ACID特性 B.需要很好的性能伸缩能力 C.需要在海量数据中实现高效的随机读取 D.能够同时处理结构化和非结构化的数据
单项选择题下面关于HDFS架构关键设计要点错误的是()。
A.支持回收站机制,以及副本数的动态设置机制 B.数据存储以数据块为单位,存储在操作系统的HDFS文件系统上 C.提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据 D.HDFS对外仅呈现多个统一的文件系统
单项选择题数据化最早的根基包括什么:()。
A.计量 B.记录 C.阿拉伯数字 D.字母
单项选择题下列对Dataset的描述错误的是:()。
A.DataSet是一个由特定域的对象组成的强类型集合。 B.DataSet以Catalyst逻辑执行计划表示,并且数据以编码的二进制形式存储。 C.DataSet需要反序列化才可以执行sort、filter、shuffle等操作。 D.DataSet只在执行action操作时触发计算。
单项选择题下列关于Yarn-client与Yarn-cluster的区别描述正确的是()。
A.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别。 B.Yarn-client适合生存,Yarn-cluster适合生产。 C.Yarn-cluster任务提交节点宕机,整个任务会失败。Yarn-client不会。 D.没有区别。
单项选择题MapReduce适合做下列哪项()。
A.迭代计算 B.离线计算 C.实时交互计算 D.流式计算