A.KMeans B.SVMWithSGD C.ALS D.LinearRegressionWithSGD
多项选择题对于MLlib中向量与LabledPoint,以下描述正确的是()
A.LabledPoint是一种基于向量扩展得到的数据结构 B.向量既可以是本地的也可以是分布式的 C.MLlib中既可以定义稀疏向量也可以定义密集向量 D.在LabledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员
多项选择题对MLlib的特点描述正确的是()
A.运算速度快,适用于具有较多迭代次数的算法 B.具有易用性,RDD中封装了大量的操作,ᨀ供了经典机器学习算法的API C.集成度高,能够与Spark上的其他组件进行无缝对接 D.运行原理是将Spark程序转换为MapReduce程序运行,并行度高
多项选择题以下对于GraphX中triangleCount()的描述错误的是()
A.用以实现三角形计数功能 B.返回的数据是顶点集合 C.要求边是规范的指向(srcId〈dstId) D.返回的数据是图
多项选择题对GraphX以下描述正确的是()
A.GraphX是一种基于内存的分布式的图计算框架与图计算库 B.GraphX中引入了弹性分布式属性图 C.GraphX实现了表视图与图视图的统一 D.GraphXᨀ供了丰富的PregelAPI用以实现经典的图计算算法
多项选择题令ds为SparkStreaming中DStream的一个实例,下列叙述正确的是()
A.ds上的操作都作用于其中的每个RDD上 B.ds.count结果返回一个RDD C.ds.reduceByKey结果返回一个DStream类型实例 D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.