Apache spark 如何将重复边视为Graphx中唯一的边?

Apache spark 如何将重复边视为Graphx中唯一的边?,apache-spark,spark-graphx,Apache Spark,Spark Graphx,我正在边缘列表上与Graphx一起工作。问题是一条边重复了两次。我的意思是如果(1,2)存在,那么就有(2,1)。但这是多余的,只需要更多的内存。我只想要一个。例如,我的图表如下所示 (1,2) (1,3) (2,1) (2,5) (3,1) ... 但我希望边缘列表是这样的 (1,2) (1,3) (2,5) ... 有人有主意吗

我正在边缘列表上与Graphx一起工作。问题是一条边重复了两次。我的意思是如果(1,2)存在,那么就有(2,1)。但这是多余的,只需要更多的内存。我只想要一个。例如,我的图表如下所示

(1,2)
(1,3)
(2,1)
(2,5)
(3,1)
...
但我希望边缘列表是这样的

(1,2)
(1,3)
(2,5)
...
有人有主意吗