多项选择题
A.RDD、DataFrame、DataSet全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便……
下列关于RDD、DataFrame和DataSet描述正确的是()。
A.RDD、DataFrame、DataSet全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便利
B.三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历运算
C.在对DataFrame和Dataset进行操作许多操作都需要进行引入:import spark.implicits._
D.DataFrame可以通过toDS转化为DataSet