A.填补数据中的空缺值B.集成多个数据源的数据C.得到数据集的压缩表示D.规范化数据
单项选择题在架构的设计上,Spark是以()作为资源分配单位。
A.块(block)B.槽(slot)C.Map槽D.Reduce槽
单项选择题()允许用户设置若干个网站,将页面从服务器中下载到用户的硬盘中,从而可以在不连接互联网的前提下进行Web浏览。
A.Web挖掘B.网络舆情C.数据采集D.离线浏览
单项选择题AnalyticDB有优势不包括()。
A.更大规模和更快读写能力B.更高可用和可靠性C.更高安全D.分布式计算能力
单项选择题用于数据流处理的分布式并行计算框架是()。
A.Hadoop分布式并行计算框架B.Storm分布式并行计算框架C.Hive分布式并行计算框架D.Spark分布式并行计算框架
单项选择题下列关于使用参照表清洗数据说法错误的是()。
A.有些数据无法从内部发现错误,需要结合外部的数据进行参照B.只要方法得当,数据内部是可以发现错误的,不需要借助参照表C.使用参数表可以校验数据的准确性D.使用参照表可以处理数据的一致性