A.数据对齐B.模式对齐C.记录链接D.数据融合
多项选择题传统数据集成的方法主要解决()。
A.语义歧义性B.实例表示歧义性C.数据不一致性D.数据冗余性
单项选择题从数据产生速度来看,传统数据采集的数据几乎都是由人操作生成的,()机器生成数据的效率。
A.远远快于B.等于C.远远慢于D.无法确定
单项选择题通过()建立快速的查询系统,进行业务分析。
A.SparkCore组件B.SparkSQL组件C.SparkStreaming组件D.SparkMLlib组件
单项选择题Hadoop组件中分布式处理框架是()。
A.FlumeB.MapReduceC.YarnD.Storm
单项选择题Spark任务执行器中有存储模块,会将()作为存储设备,当需要多轮迭代计算时,可以将中间结果存储到这个存储模块里,有效减少了IO开销。
A.磁盘B.内存C.内存和磁盘D.光盘