个性化阅读
专注于IT技术分析

标签:RDD持久性

Hadoop

RDD持久性

半瓶木阅读(810)评论(0)赞(0)

通过将数据持久存储在操作中的内存中, Spark提供了一种方便的方法来处理数据集。在保留RDD时, 每个节点都会将其计算的所有分区存储在内存中。现在, 我们还可以在该数据集的其他任务中重用它们。 我们可以使用persist()或cache(...