判断题spark中的持久化,只是将数据保存在内存中或者本地磁盘文件中,RDD的lineage(血缘关系)是不变的。
判断题spark中在划分Stage的时候,遇到窄依赖就会划分出前后两个Stage。
判断题RDD是spark提供的核心抽象,全称为Resillient Distributed Dataset,只能通过文件创建。
判断题RDD是一个提供了许多操作接口的数据集合。
判断题spark只支持用Scala语言进行开发。