A.需要完全拥有传统关系型数据库所具备的ACID特性 B.需要很好的性能伸缩能力 C.需要在海量数据中实现高效的随机读取 D.能够同时处理结构化和非结构化的数据
单项选择题下面关于HDFS架构关键设计要点错误的是()。
A.支持回收站机制,以及副本数的动态设置机制 B.数据存储以数据块为单位,存储在操作系统的HDFS文件系统上 C.提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据 D.HDFS对外仅呈现多个统一的文件系统
单项选择题数据化最早的根基包括什么:()。
A.计量 B.记录 C.阿拉伯数字 D.字母
单项选择题下列对Dataset的描述错误的是:()。
A.DataSet是一个由特定域的对象组成的强类型集合。 B.DataSet以Catalyst逻辑执行计划表示,并且数据以编码的二进制形式存储。 C.DataSet需要反序列化才可以执行sort、filter、shuffle等操作。 D.DataSet只在执行action操作时触发计算。
单项选择题下列关于Yarn-client与Yarn-cluster的区别描述正确的是()。
A.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别。 B.Yarn-client适合生存,Yarn-cluster适合生产。 C.Yarn-cluster任务提交节点宕机,整个任务会失败。Yarn-client不会。 D.没有区别。
单项选择题MapReduce适合做下列哪项()。
A.迭代计算 B.离线计算 C.实时交互计算 D.流式计算
单项选择题YAEN中资源抽象用什么表示()。
A.内存 B.CPU C.Container D.磁盘空间
单项选择题HDFS不包含下列哪个角色()。
A.NameNode B.DataNode C.Blocks D.Client
单项选择题下列属于HDFS适用的场景()。
A.低时间延迟数据访问的应用 B.大量小文件 C.多用户写入 D.大文件存
单项选择题RDD有哪两种依赖关系()。
A.长依赖和短依赖 B.高依赖和低依赖 C.宽依赖和窄依赖 D.左依赖和右依赖
单项选择题Kafka消息传输保障机制,是一种通过配置不同的消息发送模式来保障消息传输,进而满足不同的可靠性要求应用场景的机制。当同步发送带确认且无副本时,为何种传输方式()。
A.最多一次 B.至少一次 C.仅有一次 D.消息可能丢失或重复