R 在超过一定数量的列中重复查找多个列中的重复项

R 在超过一定数量的列中重复查找多个列中的重复项,r,duplicates,R,Duplicates,我有一个.CSV文件,其中包含多个列和上百行,在不同的列中有一些共享元素(重复项)。 有谁能给我推荐一个R中的代码,它可以找到在超过一定数量的列中重复的共享元素 例如,我想在上表中找到在超过3列中重复的元素,我希望它返回c3、a1和f1。我们可以通过在取消列表后获得元素的频率,进行列和,排序,并获得频率最高的名称 names(tail(sort(colSums(table(c(col(d1)), unlist(d1)))),3)) #[1] "a1" "c3" "f1" 数据 d1通过对ak

我有一个.CSV文件,其中包含多个列和上百行,在不同的列中有一些共享元素(重复项)。 有谁能给我推荐一个R中的代码,它可以找到在超过一定数量的列中重复的共享元素


例如,我想在上表中找到在超过3列中重复的元素,我希望它返回c3、a1和f1。

我们可以通过在
取消列表后获得元素的频率,进行列和,
排序,并获得频率最高的
名称

names(tail(sort(colSums(table(c(col(d1)), unlist(d1)))),3))
#[1] "a1" "c3" "f1"
数据
d1通过对akrun代码的细微更改,我想我发现这正是我想要的:


名称(表(未列出(d1)))[table(未列出(d1))>=3]

谢谢您的回答。代码的问题在于,它不会返回在超过x个列中重复的元素,而是返回跨列重复的x个顶部元素。例如,当您在代码中输入4(表示在4列或更多列中重复的元素)时,您希望只得到f1,但它返回“n1”“a1”“c3”“f1”,这是4个主要重复的元素。对于其他数量的x也是如此。
d1 <- structure(list(col1 = c("a1", "b2", "f1", "d1"), col2 = c("c3", 
"a1", "g1", "f1"), col3 = c("d3", "c3", "h1", "f1"), col4 = c("c3", 
"a1", "n1", "f1")), .Names = c("col1", "col2", "col3", "col4"
 ), row.names = c(NA, -4L), class = "data.frame")