A.RDD是可读、写的 B.RDD是基于内存的高度首先的数据共享模型 C.RDD是基于磁盘的高度首先的数据共享模型 D.RDD之间的依赖关系分为宽依赖与窄依赖
多项选择题Spark是大数据的综合处理框架,其综合性体现为()
A.能够对海量数据进行批处理 B.能够对海量数据进行流式计算 C.能够对海量数据进行交互式查询 D.能够对海量数据进行存储
多项选择题MapReduce框架供了一种序列化键 值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法正确的是:()
A.实现Writable接口的类是值 B.实现WritableComparable接口的类可以是值或键 C.Hadoop的基本类型Text并不实现WritableComparable接口 D.键和值的数据类型可以超出Hadoop自身支持的基本类型
多项选择题如果要将一个本地用户主目录下的数据文件a.data,上传到HDFS文件系统的 test-data 目录下,执行以下哪些命令可以实现?()
A.hadoop fs-copyFromLocal~/a.data/test-data/ B.hadoop fs-put~/a.data/test-data/ C.hdfs fs-copyFromLocal~/a.data/test-data/ D.hdfsd fs-copyFromLocal~/a.data/test-data/
多项选择题cache和pesist的描述,正确的是()
A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间 B.cache只有一个默认的缓存级别MEMORY_ONLY C.persist可调用cache,而cache可以根据情况设置缓存级别 D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
多项选择题在HDFS中,NameNode是用来管理文件系统的命名空间的。它将所有的文件和文件夹的元数据保存在一个文件系统树中。这些信息也会在硬盘上保存成以下文件:()
A.命名空间镜像 B.修改日志 C.数据块block D.分片文件