发布网友 发布时间:2024-10-24 05:33
我来回答
共1个回答
热心网友 时间:2024-11-02 01:18
rdd作为一个分布式的数据集,是分布在多个worker节点上的。如下图所示,RDD1有五个分区(partition),他们分布在了四个worker nodes 上面,RDD2有三个分区,分布在了三个worker nodes上面。