A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间 B.cache只有一个默认的缓存级别MEMORY_ONLY C.persist可调用cache,而cache可以根据情况设置缓存级别 D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
多项选择题在HDFS中,NameNode是用来管理文件系统的命名空间的。它将所有的文件和文件夹的元数据保存在一个文件系统树中。这些信息也会在硬盘上保存成以下文件:()
A.命名空间镜像 B.修改日志 C.数据块block D.分片文件
多项选择题以下哪些项是HDFS(Hadoop分布式文件系统)设计的前景和目标?()
A.大数据 B.硬件错误是常态 C.流式数据访问 D.简单一致性
多项选择题下面哪个是RDD的特点()
A.可分区B.可序列化C.可修改D.可持久化
多项选择题在MRv2中,Container是一个动态资源分配单位,将相关的资源封装在一起,包括(),从而限定每个任务的资源量
A.内存 B.磁盘 C.CPU D.IP地址
多项选择题我们可以通过下面哪几个配置文件来控制Hadoop配置。在集群重启以后,Hadoop会从这些配置文件中重新加载配置。()
A.core-site.xml B.hdfs-site.xml C.mapred-site.xml D.yarn-site.xm