A.FlumeB.MapReduceC.YarnD.Storm
单项选择题Spark任务执行器中有存储模块,会将()作为存储设备,当需要多轮迭代计算时,可以将中间结果存储到这个存储模块里,有效减少了IO开销。
A.磁盘B.内存C.内存和磁盘D.光盘
单项选择题通过()实时进行业务日志采集,快速迭代处理,并进行综合分析,能够满足线上系统分析要求。
A.SparkCore组件B.SparkSQL组件C.SparkStreaming组件D.SparkMLlib组件
单项选择题在数据同步中,适合操作型业务系统的数据同步的同步方式是()。
A.直连同步B.数据复制同步C.数据文件同步D.数据库日志解析同步
单项选择题哪个图形用来展示数据的分布情况,采用中位线、1 4分位线和3 4分位线对数据划分几个部分,能显示出异常点?()
A.箱线图B.直方图C.散点矩阵图D.饼图
单项选择题()爬取的目标资源在全互联网中,而不是某个特定领域,或者某一部分资源。
A.聚焦网络爬虫B.增量式网络爬虫C.通用网络爬虫D.深层网络爬虫