Pyspark 如何处理多个关键字值,但按第一个关键字减少?

Pyspark 如何处理多个关键字值,但按第一个关键字减少?,pyspark,Pyspark,如果我有一个键值对,比如 ('a',1),v1 ('a',2),v2 ('a',3),v3 ('b',1),v4 ('b',2),v5 ('b',3),v6 我怎样才能得到它 ('a',1),v1 ('a',2),v2+v1 ('a',3),v3+v2+v1 ('b',1),v4 ('b',2),v5+v4 ('b',3),v6+v4+v5 利用 flatmap().reducebykey() 看看——你可以做类似的事情。看看——你可以做类似的事情。

如果我有一个键值对,比如

('a',1),v1
('a',2),v2
('a',3),v3
('b',1),v4
('b',2),v5
('b',3),v6
我怎样才能得到它

('a',1),v1
('a',2),v2+v1
('a',3),v3+v2+v1
('b',1),v4
('b',2),v5+v4
('b',3),v6+v4+v5
利用

flatmap().reducebykey()
看看——你可以做类似的事情。看看——你可以做类似的事情。