判断题Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎,它是基于内存计算的大数据并行计算框架,适用于各种各样的分布式平台的系统。
判断题RDD的持久化操作有两种方法,分别是cache()方法和persist()方法。
判断题对于迭代式计算和交互式数据挖掘,RDD可以将中间计算的数据结果保存在本地磁盘中,若是后面需要中间结果参与计算时,则可以直接从磁盘中读取,从而可以极大地提高计算速度。
判断题Spark不支持在各种集群管理器(Cluster Manager)上运行。
判断题Cluster Manager负责整个集群的统一资源管理,Worker节点中的Executor是应用执行的主要进程,内部含有多个Task线程以及内存空间。