下列关于spark中的RDD描述正确的有()。
A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象
B.Resilient:表示弹性的,弹性表示
C.Destributed:分布式,可以并行在集群计算
D.Dataset:就是一个集合,用于存放数据的
此题为多项选择题。请帮忙给出正确答案和分析,谢谢!
Spark可以通过哪些外部存储创建RDD()。
如果numPartitions是分区个数 那么Spark每个RDD的分区ID范围是()。
Spark的RDD持久化操作有()方式。
Spark中每一个RDD都可以用不同的存储级别进行保存 从而允许持久化数据集在硬盘或者在内存作为序列化的______对象。
请简述如何获取Spark的RDD分区方式。
Spark RDD的依赖机制包括()。