R 合并不相等的面板数据时重复行
我需要合并两个不同大小的面板数据集。这些数据集都由坐标列地理参考。其中一个数据集中的单元是网格单元,它们共同覆盖了整个世界。此数据集的坐标是指网格单元的质心。另一个数据集包含冲突数据,以及冲突发生的坐标 然而,当我试图按坐标合并这些数据集时,冲突事件并没有按年份正确放置,这会把一切都搞砸。我相信我可以通过创建重复的行来“修复”这个问题,其中每个网格单元年有多个冲突事件,但是我不知道如何解决这个问题R 合并不相等的面板数据时重复行,r,dataframe,merge,rstudio,R,Dataframe,Merge,Rstudio,我需要合并两个不同大小的面板数据集。这些数据集都由坐标列地理参考。其中一个数据集中的单元是网格单元,它们共同覆盖了整个世界。此数据集的坐标是指网格单元的质心。另一个数据集包含冲突数据,以及冲突发生的坐标 然而,当我试图按坐标合并这些数据集时,冲突事件并没有按年份正确放置,这会把一切都搞砸。我相信我可以通过创建重复的行来“修复”这个问题,其中每个网格单元年有多个冲突事件,但是我不知道如何解决这个问题 Dataset1 (Grid-cell structure) X gid
Dataset1 (Grid-cell structure)
X gid row col xcoord ycoord imr_mean year
100 1 195 197 -81.75 7.25 200.00 1990
101 2 195 197 -81.75 7.25 200.00 1992
102 3 195 197 -81.75 7.25 200.00 1991
103 4 195 197 -81.75 7.25 200.00 1993
104 5 195 197 -81.75 7.25 200.00 1994
105 6 195 197 -81.75 7.25 200.00 2000
106 7 195 197 -81.75 7.25 200.00 2001
107 8 195 197 -81.75 7.25 200.00 1998
108 9 195 197 -81.75 7.25 200.00 1999
109 10 195 197 -81.75 7.25 200.00 1996
110 11 195 197 -81.75 7.25 200.00 1995
Dataset 2 (Conflict events)
X eventid gwno xcoord ycoord ndeath year
32 400032 40 24.01 -81.84 41 1994
300 410041 41 18.53 -72.33 5 1990
302 410043 41 19.66 -72.55 8 1990
308 410049 41 18.43 -72.86 13 1990
313 410054 41 18.53 -72.33 14 1990
323 410062 41 18.53 -72.33 7 1990
325 410064 41 18.97 -74.26 12 1991
326 410065 41 18.53 -72.33 13 1991
424 410151 41 18.53 -72.33 5 1993
471 410205 41 18.29 -73.82 30 1994
如有任何建议,将不胜感激
编辑:
我尝试了不同的代码,我会写一些例子
test <- merge(ds1, ds2, by.x = "xcoord", by.y = "ycoord")
test <- geo_join(ds1, ds2, by = c("xcoord", "ycoord"), max_dist = 27.5, unit = "km", mode = "full"
test <- geo_full_join(ds1, ds2, by = c(ds1$xcoord, ds2$xcoord), method = "haversine", unit = "km", max_dist = 27.5, distance_col = NULL)
test我不确定您想要的输出,但下面是使用merge
合并两个数据帧的示例
dfout <- merge(df1,df2,all = T)
请提供您在尝试合并这些数据集时使用的代码。我已经编辑了帖子@Greg
> dfout
X xcoord ycoord year gid row col imr_mean eventid gwno ndeath
1 32 24.01 -81.84 1994 NA NA NA NA 400032 40 41
2 100 -81.75 7.25 1990 1 195 197 200 NA NA NA
3 101 -81.75 7.25 1992 2 195 197 200 NA NA NA
4 102 -81.75 7.25 1991 3 195 197 200 NA NA NA
5 103 -81.75 7.25 1993 4 195 197 200 NA NA NA
6 104 -81.75 7.25 1994 5 195 197 200 NA NA NA
7 105 -81.75 7.25 2000 6 195 197 200 NA NA NA
8 106 -81.75 7.25 2001 7 195 197 200 NA NA NA
9 107 -81.75 7.25 1998 8 195 197 200 NA NA NA
10 108 -81.75 7.25 1999 9 195 197 200 NA NA NA
11 109 -81.75 7.25 1996 10 195 197 200 NA NA NA
12 110 -81.75 7.25 1995 11 195 197 200 NA NA NA
13 300 18.53 -72.33 1990 NA NA NA NA 410041 41 5
14 302 19.66 -72.55 1990 NA NA NA NA 410043 41 8
15 308 18.43 -72.86 1990 NA NA NA NA 410049 41 13
16 313 18.53 -72.33 1990 NA NA NA NA 410054 41 14
17 323 18.53 -72.33 1990 NA NA NA NA 410062 41 7
18 325 18.97 -74.26 1991 NA NA NA NA 410064 41 12
19 326 18.53 -72.33 1991 NA NA NA NA 410065 41 13
20 424 18.53 -72.33 1993 NA NA NA NA 410151 41 5
21 471 18.29 -73.82 1994 NA NA NA NA 410205 41 30