A.filter()B.groupByKey()C.reduceByKey()D.map()
单项选择题下列选项,不属于集群管理器的有()。
A.Hadoop YarnB.Apache MesosC.LocalD.Spark自带的独立调度器
单项选择题在RDD的转换算子中,主要用于(Key,Value)键值对的数据集,将具有相同Key的Value进行分组,会返回一个新的(Key,Iterable)形式的数据集的转换算子是()。
单项选择题Spark与Hadoop在基于内存的运算中,说法正确的是()。
A.Spark的运算效率是Hadoop的10倍B.Spark的运算效率是Hadoop的100倍C.Hadoop的运算效率是Spark的100倍D.Hadoop的运算效率是Spark的10倍
单项选择题在Spark RDD中,划分Stage的依据是()。
A.窄依赖B.宽依赖C.窄依赖和宽依赖D.以上选项均错误
单项选择题如果一个有向图无法从任意顶点出发经过若干条边回到该点,则这个图就是()
A.有向无环图B.无环图C.有向图D.无向有环图
单项选择题在RDD的行动算子中,用于用于返回数组的第一个元素的行动算子是()。
A.first()B.count()C.take(n)D.reduce()
单项选择题下列选项中,可以支持Scala和Python编程的交互式解释器是()。
A.HBase-ShellB.Spark-ShellC.Hadoop-ShellD.Hive-Shell
单项选择题下列选项中,可以用于退出Spark-Shell客户端的命令是()。
A.:quitB.:wqC.:qD.:exit
填空题Spark支持的操作可以分为Transformation和Action两种,其中()用于变换RDD。
填空题spark生态圈的核心是()。
填空题scala中获取数组第一个元素可以用()。
填空题scala中声明常量的关键词为()。
填空题scala的REPL提供了()模式,用于粘贴大量的代码。
填空题scala解释器也称为()。
填空题词频TF(t,d)是指词语t在()中出现的次数。