A.更大规模和更快读写能力B.更高可用和可靠性C.更高安全D.分布式计算能力
单项选择题用于数据流处理的分布式并行计算框架是()。
A.Hadoop分布式并行计算框架B.Storm分布式并行计算框架C.Hive分布式并行计算框架D.Spark分布式并行计算框架
单项选择题下列关于使用参照表清洗数据说法错误的是()。
A.有些数据无法从内部发现错误,需要结合外部的数据进行参照B.只要方法得当,数据内部是可以发现错误的,不需要借助参照表C.使用参数表可以校验数据的准确性D.使用参照表可以处理数据的一致性
单项选择题360搜索引擎的爬虫叫()。
A.百度蜘蛛B.360SpiderC.SogouspiderD.Bingbot
单项选择题百度搜索引擎的爬虫叫()。
单项选择题下列不适用于大数据流实时计算的产品是()。
A.StormB.DStreamC.FlinkD.MapReduce