Spark中RDD的本质是什么

2023-04-07 22:34:00 rdd 本质 Spark

Spark中RDD的本质是什么

RDD是Spark中的基本计算单元。RDD是一个弹性分布式数据集,可以被并行操作。RDD是不可变的,可以被分区。RDD可以从Hadoop文件,本地文件,Hive表,HBase表,Cassandra,文本文件,JSON文件,SequenceFile,其他RDD等数据源创建。

RDD的本质是什么

RDD是一个分布式的数据集,可以被并行操作。RDD是不可变的,可以被分区。RDD可以从Hadoop文件,本地文件,Hive表,HBase表,Cassandra,文本文件,JSON文件,SequenceFile,其他RDD等数据源创建。

相关文章