填空题本地向量分为稠密向量和()两种。
填空题DataFrame操作中()操作可以实现条件查询。
填空题DataFrame即带有()信息的RDD。
填空题使用()方法重新设置RDD分区个数。
填空题使用()方法将一个RDD标记为持久化。
填空题py spark命令中参数()是使用k个Worker线程本地化运行spark。
填空题py spark命令中参数()是使用一个Worker线程本地化运行spark。
填空题spark支持4种不同类型的部署方式,包括()、Standalone、spark on Mesos和spark on YARN。
填空题RDD是()的简称。
填空题spark生态系统主要包括:()、spark SQL、()、Structured Streaming、spark Mlib和GraphX。
填空题大数据计算模式主要有:()、()、图计算和查询分析计算。
填空题大数据的“4V”概念包含四个层面,分别是:()、数据类型繁多、()和价值密度低。
判断题spark任务中,action算子只能有1个。
判断题spark任务中如果没有Transformation算子,任务是不会执行的。
判断题spark中要持久化一个RDD,只能调用其cache()方法。