A.Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。 B.基于Hive,使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。 C.支持各种文件格式,如TEXTFILE 、SEQUENCEFILE 、orc、Parquet。 D.基于内存运算,不需要把中间结果写入磁盘,省掉了大量的I/O开销。
单项选择题下列哪个算子是flink独有的()。
A.map B.reduce C.partitionBy D.key by
单项选择题下列进程中不是flink的()。
A.jobmanager B.TaskManager C.master D.StandaloneSessionClusterEntrypoint
单项选择题不属于flink的window类型()。
A.Tumbling Window(滚动窗口) B.Sliding Window(滑动窗口) C.Session Window(会话窗口) D.Local Window(局部窗口)
多项选择题flink的三大部署模式。()
A.local B.standalone C.yarn D.mesos
多项选择题下列关于spark中的RDD描述正确的有()。
A.RDD(Resilient distributed dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象 B.Resilient:表示弹性的,弹性表示 C.Destributed:分布式,可以并行在集群计算 D.Dataset:就是一个集合,用于存放数据的