R中矩阵任意两列之间相同元素的最大个数_R_Matrix

R中矩阵任意两列之间相同元素的最大个数

r matrix

R中矩阵任意两列之间相同元素的最大个数,r,matrix,R,Matrix,我只是想知道是否有一种简单的方法来计算R中矩阵任意两列之间相同元素的最大数目例如，我有一个矩阵 test <- replicate(10, sample((0:3), 10, replace = TRUE)) test [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 3 0 1 0 2 2 1 0 2 0 [2,] 1 1 3

我只是想知道是否有一种简单的方法来计算R中矩阵任意两列之间相同元素的最大数目

例如，我有一个矩阵

test <- replicate(10, sample((0:3), 10, replace = TRUE))

test

      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    3    0    1    0    2    2    1    0    2     0
 [2,]    1    1    3    2    0    2    3    0    2     2
 [3,]    2    3    0    0    1    2    0    3    0     2
 [4,]    2    2    1    1    2    0    0    1    1     0
 [5,]    2    0    1    2    0    1    1    1    0     0
 [6,]    1    0    1    3    2    3    3    1    3     2
 [7,]    0    1    3    2    1    0    1    2    1     1
 [8,]    0    3    1    3    0    2    3    1    1     1
 [9,]    2    3    1    3    0    1    0    1    3     2
[10,]    3    2    1    0    2    1    3    2    3     1

所以这两列之间有两个相同的元素

现在，我可以使用两个嵌套for循环对所有列对重复此操作，然后找到最大的真实调用数，但这看起来不太好。有人能想出更好的办法吗

干杯

Maik

看到一个合理的答案被否决总是很有趣的。虽然我不喜欢这个分数，但我会保留我的答案。选民，你怎么看

让我们首先获取一些可复制的玩具数据：

set.seed(0); x <- replicate(10, sample((0:3), 10, replace = TRUE))
#      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
# [1,]    3    0    3    1    1    2    1    3    3     0
# [2,]    1    0    3    1    3    1    3    1    1     0
# [3,]    1    0    0    2    2    3    1    3    2     0
# [4,]    2    2    2    1    3    1    1    1    1     2
# [5,]    3    1    0    0    2    0    1    1    1     3
# [6,]    0    3    1    3    2    0    2    1    3     3
# [7,]    3    1    1    2    3    0    1    3    0     3
# [8,]    3    2    0    3    0    1    1    3    2     1
# [9,]    2    3    1    0    1    2    3    1    0     1
#[10,]    2    1    3    2    2    2    0    3    0     3

大卫的评论基本上做了同样的事情，但速度要慢得多：

y <- combn(ncol(x), 2, FUN = function(u) sum(x[, u[1]] == x[, u[2]]))
# [1] 1 2 3 2 4 1 4 2 3 3 1 0 0 3 1 3 5 1 3 1 2 4 1 4 3 4 2 3 5 1 1 3 2 1 2 2 3 3
#[39] 1 2 3 1 4 3 1
max(y)
# [1] 5

请注意，由于对称性，仅计算下三角矩阵。对角线都是零（或航向）。
试试：

max(combn(split(test, col(test)), 2, function(x) sum(x[[1]] == x[[2]])))

如果你想知道哪一对有最多的相等元素，那就有点复杂了。
试试
combn（ncol（test），2，FUN=function（x）sum（test[，x[1]]==test[，x[2]]）
maybe@DavidArenburg信不信由你，我没有。我在发布我的答案之前看到了你的评论，但我还是决定发布它。
y <- combn(ncol(x), 2, FUN = function(u) sum(x[, u[1]] == x[, u[2]])) # [1] 1 2 3 2 4 1 4 2 3 3 1 0 0 3 1 3 5 1 3 1 2 4 1 4 3 4 2 3 5 1 1 3 2 1 2 2 3 3 #[39] 1 2 3 1 4 3 1 max(y) # [1] 5

set.seed(0); x <- replicate(1e+3, sample((0:3), 10, replace = TRUE)) system.time(unlist(lapply(seq_len(ncol(x)-1L), function(i) colSums(x[, (i+1):ncol(x), drop = FALSE] == x[, i])))) # user system elapsed # 0.176 0.032 0.207 system.time(combn(ncol(x), 2, FUN = function(u) sum(x[, u[1]] == x[, u[2]]))) # user system elapsed # 4.692 0.008 4.708

y <- unlist(lapply(seq_len(ncol(x)-1L), function(i) colSums(x[, (i+1):ncol(x), drop = FALSE] != x[, i]))) z <- matrix(0L, ncol(x), ncol(x)) z[lower.tri(z)] <- y # [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] # [1,] 0 0 0 0 0 0 0 0 0 0 # [2,] 9 0 0 0 0 0 0 0 0 0 # [3,] 8 7 0 0 0 0 0 0 0 0 # [4,] 7 9 9 0 0 0 0 0 0 0 # [5,] 8 10 7 7 0 0 0 0 0 0 # [6,] 6 10 9 6 9 0 0 0 0 0 # [7,] 9 7 8 8 7 8 0 0 0 0 # [8,] 6 9 6 7 8 7 8 0 0 0 # [9,] 8 7 9 5 9 7 7 6 0 0 #[10,] 7 5 6 9 8 9 9 7 9 0

max(combn(split(test, col(test)), 2, function(x) sum(x[[1]] == x[[2]])))