A.CB.C++C.JAVAD.Scala
单项选择题以下选项中不是Hadoop的特性的为()。
A.高可靠性B.高扩展性C.高效性D.高成本
多项选择题zookeeper关键特性有哪些()。
A.原子性B.最终一致性C.实时性D.可靠性
单项选择题RDD有哪两种依赖关系()。
A.长依赖和短依赖 B.高依赖和低依赖 C.宽依赖和窄依赖 D.左依赖和右依赖
多项选择题当前大数据产业发展的特点是()
A.规模比较小B.增速很快C.增速缓慢D.多产业交叉融合
单项选择题HBase的最小存储单元是什么?()
A.RegionB.ColumnFamilyC.ColumnD.Cell
单项选择题zookeeper使用什么语言编写()。
A.CB.C++C.C#D.Java
单项选择题在MapReduce计算过程中的Shuffle阶段,以下哪个不是对MapTask的处理()。
A.分区 B.排序 C.分离 D.合并
单项选择题下列对于HDFS数据读取流程的描述正确的是()。
A.HDFS数据读取流程是完整的读取流程,当读取完成后,会调用close()函数关闭连接。 B.读取过程中,Client采用就远原则读取数据 C.每次读取都会将每一个DateNode都读取一遍 D.读取过程通过调用begin()函数开始
单项选择题下列关于大数据的分析理念的说法中,错误的是()。
A.在数据基础上倾向于全体数据而不是抽样数据 B.在分析方法上更注重相关分析而不是因果分析 C.在分析效果上更追究效率而不是绝对精确 D.在数据规模上强调相对数据而不是绝对数据
单项选择题下列关于聚类挖掘技术的说法中,错误的是()。
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B.要求同类数据的内容相似度尽可能小 C.要求不同类数据的内容相似度尽可能小 D.与分类挖掘技术相似的是,都是要对数据进行分类处理
单项选择题下面选项中哪一项没有体现大数据的应用()。
A.计算学校实验室电脑数量 B.淘宝双十一数据 C.网易云音乐推荐 D.百度搜索推荐
单项选择题Spark的核心代码有多少行()。
A.3百行 B.3千行 C.3万行 D.3亿行
单项选择题下面哪点不是MapReduce的优点()。
A.易于编程 B.良好的扩展性 C.高容错性 D.使用的人多
单项选择题下列论据中,能够支撑“大数据无所不能”的观点的是()。
A.互联网金融打破了传统的观念和行为 B.大数据存在泡沫 C.大数据具有非常高的成本 D.个人隐私泄露与信息安全担忧
单项选择题下列关于数据交易市场的说法中,错误的是()。
A.数据交易市场是大数据产业发展到一定程度的产物 B.商业化的数据交易活动催生了多方参与的第三方数据交易市场 C.数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D.数据交易市场是大数据资源化的必然产物