A.ds上的操作都作用于其中的每个RDD上 B.ds.count结果返回一个RDD C.ds.reduceByKey结果返回一个DStream类型实例 D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.
多项选择题在SparkStreaming中,以下哪些数据可以作为DStream的输入源()
A.socketSteam B.kafkaSteam C.flumeSteam D.twitterSteam
多项选择题对HBase构建二级索引的实现方式有哪些?()
A.MapReduce B.Coprocessor C.BloomFilter D.Filter
多项选择题以下对Spark中RDD叙述错误的是()
A.RDD是可读、写的 B.RDD是基于内存的高度首先的数据共享模型 C.RDD是基于磁盘的高度首先的数据共享模型 D.RDD之间的依赖关系分为宽依赖与窄依赖
多项选择题Spark是大数据的综合处理框架,其综合性体现为()
A.能够对海量数据进行批处理 B.能够对海量数据进行流式计算 C.能够对海量数据进行交互式查询 D.能够对海量数据进行存储
多项选择题MapReduce框架供了一种序列化键 值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法正确的是:()
A.实现Writable接口的类是值 B.实现WritableComparable接口的类可以是值或键 C.Hadoop的基本类型Text并不实现WritableComparable接口 D.键和值的数据类型可以超出Hadoop自身支持的基本类型