Spark中RDD的本质是什么
Spark中RDD的本质是什么
RDD是Spark中的基本计算单元。RDD是一个弹性分布式数据集,可以被并行操作。RDD是不可变的,可以被分区。RDD可以从Hadoop文件,本地文件,Hive表,HBase表,Cassandra,文本文件,JSON文件,SequenceFile,其他RDD等数据源创建。
RDD的本质是什么
RDD是一个分布式的数据集,可以被并行操作。RDD是不可变的,可以被分区。RDD可以从Hadoop文件,本地文件,Hive表,HBase表,Cassandra,文本文件,JSON文件,SequenceFile,其他RDD等数据源创建。
相关文章