Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/list/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
List 如何在pyspark中将RDD列表转换为一个列表_List_Apache Spark_Pyspark - Fatal编程技术网

List 如何在pyspark中将RDD列表转换为一个列表

List 如何在pyspark中将RDD列表转换为一个列表,list,apache-spark,pyspark,List,Apache Spark,Pyspark,我有一个RDD对象,一个列表列表,看起来像这样(省略了数百万个子列表,这里只剩下3个) 我想把它转换成这样一个列表 my_list = [('a','b'),('a','c'), ('b','a'),('b','f'),('b','g'), ('zzsx','c'), ('zzsx','q'), ('zzsx','m'), ('zzsx','ay'), ('zzsx','bbt')] 我不能使用循环,因为my_tuples是一个RDD对象,而且my_tuples的大小太

我有一个RDD对象,一个列表列表,看起来像这样(省略了数百万个子列表,这里只剩下3个)

我想把它转换成这样一个列表

my_list = [('a','b'),('a','c'), ('b','a'),('b','f'),('b','g'), 
           ('zzsx','c'), ('zzsx','q'), ('zzsx','m'), ('zzsx','ay'), ('zzsx','bbt')]

我不能使用循环,因为
my_tuples
是一个RDD对象,而且
my_tuples
的大小太大,无法使用循环。我是spark的新手,欢迎提出任何建议。谢谢。

您可以使用
flatMap
将其展平:

rdd.flatMap(lambda l: l)
因为您的元素是列表,所以您可以在函数中返回这些列表,如示例所示

[('a', 'b'),
 ('a', 'c'),
 ('b', 'a'),
 ('b', 'f'),
 ('b', 'g'),
 ('zzsx', 'c'),
 ('zzsx', 'q'),
 ('zzsx', 'm'),
 ('zzsx', 'ay'),
 ('zzsx', 'bbt')]
[('a', 'b'),
 ('a', 'c'),
 ('b', 'a'),
 ('b', 'f'),
 ('b', 'g'),
 ('zzsx', 'c'),
 ('zzsx', 'q'),
 ('zzsx', 'm'),
 ('zzsx', 'ay'),
 ('zzsx', 'bbt')]