A.保留第一个valueB.保留最后一个valueC.保留所有value的值D.保留所有value的值构成的集合
多项选择题下列哪些操作会将pair RDD的数据量减少一半 ()
A.rdd.keysB.rdd.sortByKey()C.rdd.mapValues(x=>x+1)D.rdd.values
单项选择题当缓存丢失时,RDD如何处理? ()
A.全部数据重头计算B.从不计算丢失数据C.计算一部分丢失数据D.计算全部丢失数据
多项选择题下列RDD缓存级别中哪些CPU时间较高? ()
A.MEMORY_ONLYB.MEMORY_ONLY_SERC.MEMORY_ONLY_DISKD.MEMEORY_ONLY_DISK_SER
多项选择题在RDD缓存级别中哪些有部分需要磁盘上? ()
单项选择题在RDD缓存级别中哪个不是在内存中?()
A.MEMORY_ONLYB.MEMORY_ONLY_SERC.MEMORY_ONLY_DISKD.DISK_ONLY
单项选择题在RDD缓存级别中哪个级别CPU时间使用最低? ()
单项选择题RDD被缓存时所在的JVM的内存区域为? ()
A.堆B.栈C.常量池D.数据池
单项选择题在Spark中,collect方法的返回值类型是? ()
A.ArrayB.MapC.SetD.List
单项选择题sc.makeRDD(1 to 10,2).collect().foreach(println)的作用是? ()
A.打印十次2B.打印1到9两遍C.打印1到9D.打印1到10
单项选择题下列哪一个方法在保存文件时会将RDD序列化成对象? ()
A.saveAsTextFileB.saveAsSequenceFileC.saveAsObjectFileD.以上都不是
单项选择题在Spark中,下列哪一个方法有折叠的功能?()
A.foldB.takeOrderedC.takeSampleD.take
多项选择题下列选项中有哪些函数属于行动操作? ()
A.collectB.countC.firstD.take
单项选择题在Spark中,reduce方法有什么样的功能? ()
A.减少计算开销B.减少计算时间C.返回第一元素D.聚集所有元素
单项选择题在Spark中,sortByKey的作用是什么? ()
A.通过值排序返回原RDDB.通过值排序返回新RDDC.通过键排序返回原RDDD.通过键排序返回新RDD
多项选择题以下函数中不是行动操作的函数有哪些? ()
A.sortByB.unionC.subtractD.intersection