判断题

spark中基于序列化的持久化方式，主要是为了减少内存空间的占用。

【参考答案】

正确

<上一题目录下一题>

热门试题

判断题spark中的累加器可以实现优化性能，减少网络传输以及内存消耗。

判断题spark中使用累加器的时候，只能在Driver进程中才能获取累加器的结果。

判断题spark中的持久化，只是将数据保存在内存中或者本地磁盘文件中，RDD的lineage（血缘关系）是不变的。

判断题spark中在划分Stage的时候，遇到窄依赖就会划分出前后两个Stage。

判断题RDD是spark提供的核心抽象，全称为Resillient Distributed Dataset，只能通过文件创建。