Pyspark Pypark中各组的Spearman相关性

Pyspark Pypark中各组的Spearman相关性,pyspark,group-by,correlation,Pyspark,Group By,Correlation,是否有任何方法可以获得每个分组数据的相关性 比如说 Country | rank1 | rank2 Us 3 4 Us 1 2 Us 4 1 Ru 1 7 Ru 5 3 Ru 2 6 我想同时得到rank1和rank1之间的相关性。但按国家分组。美国的相关系数和俄罗斯的相关系数。所有结果,而不是按国家过滤,并分别进行每个关联,

是否有任何方法可以获得每个分组数据的相关性

比如说

Country  | rank1 | rank2
Us         3       4
Us         1       2
Us         4       1
Ru         1       7
Ru         5       3
Ru         2       6

我想同时得到rank1和rank1之间的相关性。但按国家分组。美国的相关系数和俄罗斯的相关系数。所有结果,而不是按国家过滤,并分别进行每个关联,这需要循环

我不确定是哪种格式。我只想得到每个国家的相关结果。