A.JSONB.CSVC.SequenceD.对象文件
单项选择题在读取文件中,如果读取文件夹,被看成RDD的是什么? ()
A.每一个文件B.子文件夹C.整个文件夹D.看情况而定
单项选择题在读取文件过程变成RDD过程中,元素是指文件的什么? ()
A.整个文件内容B.文件的一行C.文件的一段D.文件中特定符号
单项选择题使用collectAsMap()时如果key对应多个value,会如何处理?()
A.保留第一个valueB.保留最后一个valueC.保留所有value的值D.保留所有value的值构成的集合
多项选择题下列哪些操作会将pair RDD的数据量减少一半 ()
A.rdd.keysB.rdd.sortByKey()C.rdd.mapValues(x=>x+1)D.rdd.values
单项选择题当缓存丢失时,RDD如何处理? ()
A.全部数据重头计算B.从不计算丢失数据C.计算一部分丢失数据D.计算全部丢失数据
多项选择题下列RDD缓存级别中哪些CPU时间较高? ()
A.MEMORY_ONLYB.MEMORY_ONLY_SERC.MEMORY_ONLY_DISKD.MEMEORY_ONLY_DISK_SER
多项选择题在RDD缓存级别中哪些有部分需要磁盘上? ()
单项选择题在RDD缓存级别中哪个不是在内存中?()
A.MEMORY_ONLYB.MEMORY_ONLY_SERC.MEMORY_ONLY_DISKD.DISK_ONLY
单项选择题在RDD缓存级别中哪个级别CPU时间使用最低? ()
单项选择题RDD被缓存时所在的JVM的内存区域为? ()
A.堆B.栈C.常量池D.数据池
单项选择题在Spark中,collect方法的返回值类型是? ()
A.ArrayB.MapC.SetD.List
单项选择题sc.makeRDD(1 to 10,2).collect().foreach(println)的作用是? ()
A.打印十次2B.打印1到9两遍C.打印1到9D.打印1到10
单项选择题下列哪一个方法在保存文件时会将RDD序列化成对象? ()
A.saveAsTextFileB.saveAsSequenceFileC.saveAsObjectFileD.以上都不是
单项选择题在Spark中,下列哪一个方法有折叠的功能?()
A.foldB.takeOrderedC.takeSampleD.take
多项选择题下列选项中有哪些函数属于行动操作? ()
A.collectB.countC.firstD.take