保留具有不同名称的重复列。R_R_Duplicates

保留具有不同名称的重复列。R

保留具有不同名称的重复列。R,r,duplicates,R,Duplicates,我想保留重复的列，并删除唯一的列。这些列将具有相同的值，但名称不同 x1 = rnorm(1:10) x2 = rnorm(1:10) x3 = x1 x4 = rnorm(1:10) x5 = x2 x6 = rnorm(1:10) x7 = rnorm(1:10) df = data.frame(x1,x2,x3,x4,x5,x6,x7) 从这里我将保留列x1、x2、x3和x5 python还有一个类似的问题：在数据的转置版本上使用duplicated，因为该函数默认检查行而不是列的重复

我想保留重复的列，并删除唯一的列。这些列将具有相同的值，但名称不同

x1 = rnorm(1:10)
x2 = rnorm(1:10)
x3 = x1
x4 = rnorm(1:10)
x5 = x2
x6 = rnorm(1:10)
x7 = rnorm(1:10)
df = data.frame(x1,x2,x3,x4,x5,x6,x7)

从这里我将保留列x1、x2、x3和x5

python还有一个类似的问题：

在数据的转置版本上使用

duplicated

，因为该函数默认检查行而不是列的重复

df[duplicated(t(df)) | duplicated(t(df), fromLast=TRUE)]

#            x1         x2          x3         x5
#1   1.82633666  1.2271611  1.82633666  1.2271611
#2  -1.33187496  0.9654359 -1.33187496  0.9654359
#...

正如@Frank所指出的，您还可以将

df

视为

向量的列表

df[duplicated(c(df)) | duplicated(c(df), fromLast=TRUE)]

或者可以显式调用数组
方法，指定要检查重复项的列：
df[duplicated.array(df, MARGIN=2) | duplicated.array(df, MARGIN=2, fromLast=TRUE)]