spark RDD有什么特点

2023-04-07 22:37:00 rdd Spark 有什么特点

Spark RDD是一种分布式数据集,它可以被并行处理。Spark RDD有两个主要特点:

1. 可以从多个数据源创建RDD,包括本地文件、HDFS文件、HBase表、Cassandra表、JSON文件、Parquet文件等。

2. Spark RDD可以被分区,分区的数据可以并行处理。

相关文章