A.控制整个application的生命周期 B.可以控制dagsheduler组件 C.可以控制taskscheduler组件 D.SparkContext为Spark的主要入口点
单项选择题HDFS有一个gzip文件大小75MB,客户端设置Block大小为64M。当运行MapReduce任务读取该文件时input split大小为多少()
A.64M B.75M C.一个map读取64M,另外一个map读取11M D.一个map读取11M,另外一个map读取64M
单项选择题以下哪个命令用来启动HDFS系统:()
A.start-dfs.sh B.stop-dfs.sh C.sbin/mr-jobhistory-daemon.sh start historyserver D.jps
单项选择题执行如下哪个命令,用来初始化name目录和data目录()
A.hadoop namenode-jar B.hadoop namenode-format C.hadoop datanode-jar D.hadoop datanode-format
单项选择题Standalone模式下配置Spark集群时,master节点的工作端口号需要在conf文件夹下的哪个文件指明()
A.regionserver B.spark-env.sh C.spark-defaults.conf D.slaves
单项选择题MLlib供的分布式矩阵中,既有行索引,又有列索引的是()
A.RowMatrix B.IndexedRowMatrix C.Matrix D.CoordinateMatrix