判断题RDD的持久化操作有两种方法,分别是cache()方法和persist()方法。
判断题对于迭代式计算和交互式数据挖掘,RDD可以将中间计算的数据结果保存在本地磁盘中,若是后面需要中间结果参与计算时,则可以直接从磁盘中读取,从而可以极大地提高计算速度。
判断题Spark不支持在各种集群管理器(Cluster Manager)上运行。
判断题Cluster Manager负责整个集群的统一资源管理,Worker节点中的Executor是应用执行的主要进程,内部含有多个Task线程以及内存空间。
判断题在数据科学应用中,数据工程师可以利用Spark进行数据分析与建模。