R合并而不复制列_R_Merge_Dataframe

R合并而不复制列

r merge dataframe

R合并而不复制列,r,merge,dataframe,R,Merge,Dataframe,我有两个数据帧。比如说 require('xlsx') csvData <- read.csv("myData.csv") xlsData <- read.xlsx("myData.xlsx") xlsData如下所示： Period CPI VIX 1 0.029 31.740 2 0.039 32.840 3 0.028 34.720 4 0.011 43.740 5 -0.003 35.3

我有两个数据帧。比如说

require('xlsx')
csvData <- read.csv("myData.csv")
xlsData <- read.xlsx("myData.xlsx")

xlsData如下所示：

Period  CPI     VIX
1       0.029   31.740
2       0.039   32.840
3       0.028   34.720
4       0.011   43.740
5       -0.003  35.310
6       0.013   26.090
7       0.032   28.420
8       0.022   45.080

Period  CPI     DJIA
1       0.029   12176
2       0.039   10646
3       0.028   11407
4       0.011   9563
5       -0.003  10708
6       0.013   10776
7       0.032   9384
8       0.022   7774

当我合并这些数据时，CPI数据被复制，并且在标题上加了一个后缀，这是有问题的（我的实际df中有更多的列）

我希望合并数据帧，而不复制具有相同名称的列。例如，我想要这种输出：

Period  CPI     VIX     DJIA
1       0.029   31.740  12176
2       0.039   32.840  10646
3       0.028   34.720  11407
4       0.011   43.740  9563
5       -0.003  35.310  10708
6       0.013   26.090  10776
7       0.032   28.420  9384
8       0.022   45.080  7774

我不想使用额外的“by”参数，也不想从一个df中删除列，因为两个df中重复的列太多了。我只是在寻找一种在合并过程中删除那些重复列的动态方法

谢谢

如果公共列的名称相同，则可以跳过

by

参数

从

？合并：
默认情况下，数据帧合并到具有名称的列上，但列的单独规范可以由By.x
和By.y
给出
记住这一点，以下内容应该起作用（正如它对示例数据所起的作用）：
您还可以按名称为您感兴趣的特定列编制索引。如果您只需要一个大型数据帧中的单个列/向量，这将非常有用
Period <- seq(1,8)
CPI <- seq(11,18)
VIX <- seq(21,28)
DJIA <- seq(31,38)
Other1 <- paste(letters)[1:8]
Other2 <- paste(letters)[2:9]
Other3 <- paste(letters)[3:10]

df1<- data.frame(Period,CPI,VIX)
df2<- data.frame(Period,CPI,Other1,DJIA,Other2,Other3)

merge(df1,df2[c("Period","DJIA")],by="Period") 

> merge(df1,df2[c("Period","DJIA")],by="Period")
  Period CPI VIX DJIA
1      1  11  21   31
2      2  12  22   32
3      3  13  23   33
4      4  14  24   34
5      5  15  25   35
6      6  16  26   36
7      7  17  27   37
8      8  18  28   38

谢谢。我不知道“by”是可选的。如果我的df长度不同怎么办？例如，假设csvData只有7行。我想保留xlsData的所有数据。然后cbind csvData（对于与csvData相对应的第8行，可以使用NULL）。@Clark，使用all=TRUE
也许？示例：merge（csvdata[1:7]，xlsdata，all=TRUE）
Period  CPI     VIX     DJIA
1       0.029   31.740  12176
2       0.039   32.840  10646
3       0.028   34.720  11407
4       0.011   43.740  9563
5       -0.003  35.310  10708
6       0.013   26.090  10776
7       0.032   28.420  9384
8       0.022   45.080  7774

merge(csvData, xlsData)
#   Period    CPI   VIX  DJIA
# 1      1  0.029 31.74 12176
# 2      2  0.039 32.84 10646
# 3      3  0.028 34.72 11407
# 4      4  0.011 43.74  9563
# 5      5 -0.003 35.31 10708
# 6      6  0.013 26.09 10776
# 7      7  0.032 28.42  9384
# 8      8  0.022 45.08  7774

Period <- seq(1,8)
CPI <- seq(11,18)
VIX <- seq(21,28)
DJIA <- seq(31,38)
Other1 <- paste(letters)[1:8]
Other2 <- paste(letters)[2:9]
Other3 <- paste(letters)[3:10]

df1<- data.frame(Period,CPI,VIX)
df2<- data.frame(Period,CPI,Other1,DJIA,Other2,Other3)

merge(df1,df2[c("Period","DJIA")],by="Period") 

> merge(df1,df2[c("Period","DJIA")],by="Period")
  Period CPI VIX DJIA
1      1  11  21   31
2      2  12  22   32
3      3  13  23   33
4      4  14  24   34
5      5  15  25   35
6      6  16  26   36
7      7  17  27   37
8      8  18  28   38