判断题在spark的web图形界面master:4040,可以看到执行persist后,都有是否缓存数据成功。
判断题在spark的web图形界面master:8080,可以看到master的运行情况。
判断题在spark中,如果RDD数据大于内存空间,那么执行persist()方法,只能将数据缓存到磁盘中。
判断题在spark中,对RDD的transformation操作,是延迟执行的。
判断题在spark中,RDD的数据来源,可以是持久化的存储,也可以来自于RDD的转换。