A.数据分区B.数据分片C.数据排序D.数据合并
多项选择题下列哪些项是采用并行运算的原因()。
A.节约时间和成本B.提高并发性C.更好地利用并行硬件D.充分利用局部的资源
多项选择题传统数据集成的步骤包括()。
A.数据对齐B.模式对齐C.记录链接D.数据融合
多项选择题传统数据集成的方法主要解决()。
A.语义歧义性B.实例表示歧义性C.数据不一致性D.数据冗余性
单项选择题从数据产生速度来看,传统数据采集的数据几乎都是由人操作生成的,()机器生成数据的效率。
A.远远快于B.等于C.远远慢于D.无法确定
单项选择题通过()建立快速的查询系统,进行业务分析。
A.SparkCore组件B.SparkSQL组件C.SparkStreaming组件D.SparkMLlib组件