A.海量数据 B.低吞吐量 C.能够同时处理结构化和非结构化数 D.需要良好的性能伸缩能力
多项选择题HDFS适合如下哪些工作()。
A.大文件的存储与访问 B.随机写入 C.流式数据访问 D.低延迟读取
多项选择题zookeeper关键特性有哪些()。
A.原子性B.最终一致性C.实时性D.可靠性
多项选择题Hive与传统数据仓库比较有什么区别()。
A.易用性低 B.可靠性高 C.对环境依赖性高 D.价格更高
多项选择题容量调度器的特点有哪些()。
A.灵活性 B.支持优先级 C.多重租赁 D.动态更新配置文件
多项选择题当前大数据产业发展的特点是()
A.规模比较小B.增速很快C.增速缓慢D.多产业交叉融合
多项选择题数据化最早的根基是什么()。
A.计量 B.数字化 C.记录 D.阿拉伯数字
多项选择题大数据人才整体上需要具备()等核心知识。
A.数学与统计知识 B.计算机相关知识 C.马克思主义哲学知识 D.市场运营管理知识 E.在特定业务领域的知识
多项选择题下列关于脏数据的说法中,正确的是()。
A.格式不规范 B.编码不统一 C.意义不明确 D.与实际业务关系不大 E.数据不完整
多项选择题当前大数据技术的基础包括()。
A.分布式文件系统 B.分布式并行计算 C.关系型数据库 D.分布式数据库
多项选择题关于Spark和Mapreduce,下列说法正确的是()。
A.性能上提升高于100倍(全内存计算) B.Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。 C.提供更多的数据集操作类型,编程模型更灵活,开发效率更高。 D.更低的容错能力(血统机制)。 E.Spark用十分之一的资源,获得10倍与Mapreduce的性能。