判断题spark任务中如果没有Transformation算子,任务是不会执行的。
判断题spark中要持久化一个RDD,只能调用其cache()方法。
判断题spark中基于序列化的持久化方式,主要是为了减少内存空间的占用。
判断题spark中的累加器可以实现优化性能,减少网络传输以及内存消耗。
判断题spark中使用累加器的时候,只能在Driver进程中才能获取累加器的结果。