A.指定按哪些列进行数据聚合B.指定按哪些列进行数据排序C.指定按哪些列进行数据分区D.指定按哪些列进行数据分发
单项选择题Hadoop计算组件使用的是()。
A.YarnB.MapReduceC.HDFSD.mysql
单项选择题在Hive中使用DISTRIBUTE BY关键字进行哈希分区时,会把相同值的数据分配到什么地方进行处理?()
A.同一个map任务B.不同的reduce任务C.不同的map任务D.同一个reduce任务
单项选择题在Hive中,DISTRIBUTE BY和SORT BY组合语句的执行顺序是什么?()
A.先进行排序,再进行分区B.执行顺序没有严格要求C.分区和排序是同时进行的D.先进行分区,再进行排序
单项选择题在Hive中,下面哪个选项可以用于在Join操作中指定连接条件?()
A.ONB.WHEREC.ANDD.HAVING
单项选择题下面关于Hive SQL中INSERT INTO和INSERT OVERWRITE的区别说法正确的是()
A.INSERT INTO会覆盖已经存在的数据B.NSERT INTO重复的数据会报错C.INSERT OVERWRITE不考虑原始表的数据,直接追加到表中D.INSERT OVERWRITE会先现将原始表的数据remove,再插入新数据