A.格式不规范 B.编码不统一 C.意义不明确 D.与实际业务关系不大 E.数据不完整
多项选择题当前大数据技术的基础包括()。
A.分布式文件系统 B.分布式并行计算 C.关系型数据库 D.分布式数据库
多项选择题关于Spark和Mapreduce,下列说法正确的是()。
A.性能上提升高于100倍(全内存计算) B.Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。 C.提供更多的数据集操作类型,编程模型更灵活,开发效率更高。 D.更低的容错能力(血统机制)。 E.Spark用十分之一的资源,获得10倍与Mapreduce的性能。
多项选择题下面关于行存储和列存储说法正确的是()。
A.行存储,数据按行存储在底层文件系统中。通常,每一行会被分配固定的空间。 B.列存储有利于增加/修改整行记录等操作;有利于整行数据的读取操作。 C.列存储整行读取时,可能需要多次I/O操作。
多项选择题FusionInsight HD系统高可靠性体现在哪些方面()。
A.所有组件无单点故障 B.所有管理节点HA C.软硬件健康状态监控 D.网络平面隔离
多项选择题有关HDFS说法正确的有()。
A.HDFS不适合存储大量小文件 B.HDFS不适合有低延迟数据访问要求的业务 C.HDFS适合流式数据访问 D.基于HDFS的应用应该使用WORN的数据读写模型编程