A.Kafka是一个分布式消息系统B.Kafka起源于LinkedIn公司C.Kafka采用Scala和Java编写D.Kafka目前与很多分布式处理系统如Apache Storm、Apache Spark等都能够较好的集成,用于实时流式数据分析
单项选择题Flume哪个配置文件用于配置Flume的运行参数?()
A.flume.shB.flume-env-template.shC.flume-env.shD.flume-site.xml
多项选择题Flume在读取数据源时,会将一行数据包装成一个Event,它主要有哪两个部分组成?()
A.HeaderB.BodyC.TitleD.Div
单项选择题如何将线上大量的业务系统日志高效地、可靠地迁移到HDFS,可以使用以下哪个工具解决?()
A.SqoopB.FlumeC.KafkaD.Kettle
多项选择题sqoop import命令中,各参数含义介绍正确的有哪些?()
A.-connect指定要导入数据的数据库B.-num-mappers指定导入数据的并行度即Map Task个数,Sqoop默认的并行度是1C.-target-dir指定HDFS导入路径,使用Sqoop从关系数据库MySQL中导入数据到HDFS时,默认导入路径是/user/用户名/表名D.-columns指定要导入的字段,字段名中间用逗号相隔,且不加空格
多项选择题以下关于Sqoop Shell命令的描述中,正确的有哪些?()
A.sqoop import:将数据从HDFS导出到关系数据库某个表。B.sqoop export:将数据从关系数据库某个表导入到HDFS。C.sqoop help:显示Sqoop帮助信息。D.sqoop list-tables:列出某个数据库下的所有表。