Pyspark Pypark中各组的Spearman相关性
是否有任何方法可以获得每个分组数据的相关性 比如说Pyspark Pypark中各组的Spearman相关性,pyspark,group-by,correlation,Pyspark,Group By,Correlation,是否有任何方法可以获得每个分组数据的相关性 比如说 Country | rank1 | rank2 Us 3 4 Us 1 2 Us 4 1 Ru 1 7 Ru 5 3 Ru 2 6 我想同时得到rank1和rank1之间的相关性。但按国家分组。美国的相关系数和俄罗斯的相关系数。所有结果,而不是按国家过滤,并分别进行每个关联,
Country | rank1 | rank2
Us 3 4
Us 1 2
Us 4 1
Ru 1 7
Ru 5 3
Ru 2 6
我想同时得到rank1和rank1之间的相关性。但按国家分组。美国的相关系数和俄罗斯的相关系数。所有结果,而不是按国家过滤,并分别进行每个关联,这需要循环我不确定是哪种格式。我只想得到每个国家的相关结果。