判断题RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Core)数目。
判断题Application中包含了多个驱动器(Driver)进程和集群上的单个执行器(Executor)进程。
判断题flatMap(func)与map(func)相似,应用于(Key,Value)键值对的数据集时,返回一个新的Key,Iterable。
判断题Spark可以运行在Hadoop模式、Mesos模式、Standalone独立模式或Cloud中。
判断题Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎,它是基于内存计算的大数据并行计算框架,适用于各种各样的分布式平台的系统。