A.HDFS B.HBase C.ZooKeeper D.MapReduce
多项选择题以下哪个操作属于shuffle过程()。
A.Sort B.Combine C.Merge D.Partition
多项选择题在信息化过程中产生的大量数据,根据其产生来源可分为两类,这两类数据是()。
A.社交数据 B.互联网数据 C.机器数据 D.统计数据
多项选择题Yarn-client与Yarn-cluster的区别包含:()。
A.Yarn-client适合测试,Yarn-cluster适合生产。 B.Yarn-client适合生产,Yarn-cluster适合测试。 C.Yarn-client任务提交节点宕机,整个任务会失败。Yarn-cluster不会。 D.Yarn-cluster任务提交节点宕机,整个任务会失败。Yarn-client不会。
多项选择题以下哪些场景是Spark应用场景?()
A.机器学 B.交互式分析 C.增量修改 D.流处理
多项选择题Spark具有以下哪些特性?()
A.代码量少 B.处理速度快 C.有不同层面的灵活性 D.巧妙借力现有大数据组件