判断题Hadoop的MapReduce进行计算时,每次产生的中间结果都是存储在内存中;而Spark在计算时产生的中间结果存储在本地磁盘中。
判断题RDD采用了惰性调用。
判断题RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Core)数目。
判断题Application中包含了多个驱动器(Driver)进程和集群上的单个执行器(Executor)进程。
判断题flatMap(func)与map(func)相似,应用于(Key,Value)键值对的数据集时,返回一个新的Key,Iterable。