A.master负责分配jobB.worker执行jobC.spark的计算是在内存中进行D.spark的计算是在硬盘中进行
单项选择题哪个不是kafka的组件?()
A.生产者B.消费者C.reduceByKeyD.kafka集群
单项选择题flume的作用?()
A.从日志中读取数据B.从mysql读取数据C.从Oracle读取数据D.从sqlserver读取数据
单项选择题哪个不是sparksql的作用?()
A.从mysql读取数据B.使用sql语句进行统计分析C.与Python代码整合使用D.不支持UDF
单项选择题py4j的作用是()。
A.生成contextB.读取rdd数据C.调用java代码的第三方python库D.存储在磁盘或HDFS
单项选择题哪个不是SparkSession封装的context ?()
A.SparkContextB.rediscontextC.SqlContextD.hivecontext
单项选择题哪个不是spark的运行模式?()
A.localB.StandloneC.Yarn clusterD.zookeeper
多项选择题在scala中有三种循环模式,分别是()。
A.whileB.do..whileC.ifD.for
多项选择题在scala中,数据分成两类?()
A.常量B.常数C.变数D.变量
多项选择题RDD主要有两大类操作,分别是()。
A.查询B.转换C.修改D.操作
多项选择题Yarn模式根据Driver在集群中的位置,分为两种,分别是()。
A.客户端模式B.主机模式C.集群模式D.单机模式
多项选择题Standalone模式的主要的节点有()。
A.ClientB.MasterC.WorkerD.Slave
多项选择题Spark的环境可以分为()。
A.单机版B.单机伪分布式C.完全分布式D.单机分布式
多项选择题以下哪些持久化方式在内存不足的情况下依然可以缓存所有数据?()
A.MEMORY_ONLYB.MEMORY_ONLY_SERC.MEMORY_AND_DISKD.DISK_ONLY
多项选择题Spark的运行模式包括()。
A.独立集群B.EC2C.Hadoop YARND.Apache Mesos
多项选择题spark可以从以下哪些地方读取数据?()
A.HDFSB.CassandraC.HbaseD.hive