A.HDFS不适合存储大量小文件 B.HDFS不适合有低延迟数据访问要求的业务 C.HDFS适合流式数据访问 D.基于HDFS的应用应该使用WORN的数据读写模型编程
多项选择题数据挖掘的常见任务有()。
A.关联分析 B.聚类分析 C.回归 D.分类
多项选择题有关HBase说法正确的有()。
A.分布式 B.列式数据库 C.非关系型数据库 D.不适合存储非结构化数据
多项选择题hadoop的两大核心组件是()。
A.HDFS B.HBase C.ZooKeeper D.MapReduce
多项选择题以下哪个操作属于shuffle过程()。
A.Sort B.Combine C.Merge D.Partition
多项选择题在信息化过程中产生的大量数据,根据其产生来源可分为两类,这两类数据是()。
A.社交数据 B.互联网数据 C.机器数据 D.统计数据