判断题join算子操作既可以属于窄依赖,也可以属于宽依赖。
判断题Hadoop的MapReduce进行计算时,每次产生的中间结果都是存储在内存中;而Spark在计算时产生的中间结果存储在本地磁盘中。
判断题RDD采用了惰性调用。
判断题RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Core)数目。
判断题Application中包含了多个驱动器(Driver)进程和集群上的单个执行器(Executor)进程。