判断题flatMap(func)与map(func)相似,应用于(Key,Value)键值对的数据集时,返回一个新的Key,Iterable。
判断题Spark可以运行在Hadoop模式、Mesos模式、Standalone独立模式或Cloud中。
判断题Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎,它是基于内存计算的大数据并行计算框架,适用于各种各样的分布式平台的系统。
判断题RDD的持久化操作有两种方法,分别是cache()方法和persist()方法。
判断题对于迭代式计算和交互式数据挖掘,RDD可以将中间计算的数据结果保存在本地磁盘中,若是后面需要中间结果参与计算时,则可以直接从磁盘中读取,从而可以极大地提高计算速度。