A.缓存加速B.统一命名空间C.消除上层计算引擎与异构UFS间的访问差异D.在多个计算引擎间共享数据
多项选择题以下哪项属于Spark SQL的优化方式()
A.基于规则的优化B.基于代价的优化C.自适应优化D.基于索引的优化
多项选择题Spark SQL适合以下哪种场景()
A.ETLB.数据加工C.OLTPD.联机事务分析
多项选择题RDD依赖关系可分为()
A.宽依赖B.窄依赖C.胖依赖D.瘦依赖
多项选择题下列关于RDD的说法正确的是()
A.RDD是分区的B.RDD是可序列化的C.RDD可以修改D.RDD可以持久化
多项选择题可以使用如下哪种包管理工具构建Spark工程()
A.MavenB.SBTC.ModD.Cargo