A.运算速度快,适用于具有较多迭代次数的算法 B.具有易用性,RDD中封装了大量的操作,ᨀ供了经典机器学习算法的API C.集成度高,能够与Spark上的其他组件进行无缝对接 D.运行原理是将Spark程序转换为MapReduce程序运行,并行度高
多项选择题以下对于GraphX中triangleCount()的描述错误的是()
A.用以实现三角形计数功能 B.返回的数据是顶点集合 C.要求边是规范的指向(srcId〈dstId) D.返回的数据是图
多项选择题对GraphX以下描述正确的是()
A.GraphX是一种基于内存的分布式的图计算框架与图计算库 B.GraphX中引入了弹性分布式属性图 C.GraphX实现了表视图与图视图的统一 D.GraphXᨀ供了丰富的PregelAPI用以实现经典的图计算算法
多项选择题令ds为SparkStreaming中DStream的一个实例,下列叙述正确的是()
A.ds上的操作都作用于其中的每个RDD上 B.ds.count结果返回一个RDD C.ds.reduceByKey结果返回一个DStream类型实例 D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.
多项选择题在SparkStreaming中,以下哪些数据可以作为DStream的输入源()
A.socketSteam B.kafkaSteam C.flumeSteam D.twitterSteam
多项选择题对HBase构建二级索引的实现方式有哪些?()
A.MapReduce B.Coprocessor C.BloomFilter D.Filter