R 求元素全部相等的最大方子矩阵

R 求元素全部相等的最大方子矩阵,r,matrix,dplyr,subset,R,Matrix,Dplyr,Subset,有人知道如何将最大K子集,使得kxk是一个具有所有相同元素的子矩阵,也就是说,该子矩阵中的所有元素必须与给定的nxn矩阵相同吗? 我在除R之外的其他编程语言中找到了许多示例。如果您知道的话,我也更喜欢dplyr 有一个链接指向其他语言的解决方案: 但当所有相同的元素彼此相邻时,此链接提供了一种特殊情况。它检索相同元素的最大块,而不是通常的子矩阵。我不想用这个条件限制子集设置。这里是一个基本的R实现 如果要在非平方矩阵中搜索最大平方子矩阵,可以尝试以下代码: r <- list() for

有人知道如何将最大K子集,使得kxk是一个具有所有相同元素的子矩阵,也就是说,该子矩阵中的所有元素必须与给定的nxn矩阵相同吗? 我在除R之外的其他编程语言中找到了许多示例。如果您知道的话,我也更喜欢dplyr

有一个链接指向其他语言的解决方案:


但当所有相同的元素彼此相邻时,此链接提供了一种特殊情况。它检索相同元素的最大块,而不是通常的子矩阵。我不想用这个条件限制子集设置。

这里是一个基本的R实现

如果要在非平方矩阵中搜索最大平方子矩阵,可以尝试以下代码:

r <- list()
for (w in rev(seq(min(dim(M))))) {
  for (rs in seq(nrow(M)-w+1)) {
    for (cs in seq(ncol(M)-w+1)) {
      mat <- M[rs-1+(1:w),cs-1+(1:w)]
      u <- unique(c(mat))
      if (all(u!=0) &length(u)==1) r[[length(r)+1]] <- mat
    }
  }
  if (length(r)>0) break
}
数据

M <- structure(c(1L, 3L, 1L, 2L, 1L, 3L, 3L, 2L, 2L, 3L, 3L, 1L, 1L, 
1L, 2L, 2L, 2L, 2L, 3L, 1L, 3L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 
2L, 2L, 1L, 3L, 1L, 3L, 2L, 2L, 2L, 2L, 3L, 2L, 1L, 3L, 2L, 1L, 
1L, 3L, 2L, 2L, 3L, 3L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L, 1L, 
3L, 3L, 2L, 3L, 3L, 2L, 3L, 3L, 1L, 1L, 1L, 1L, 3L, 2L, 3L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 3L, 2L, 1L, 1L, 3L, 3L, 3L, 2L, 2L, 2L, 
3L, 2L, 2L, 3L, 3L, 3L, 1L, 2L, 2L, 1L, 3L, 3L, 2L, 3L, 2L, 1L, 
2L, 1L, 3L, 3L, 1L, 2L, 1L, 3L, 2L, 3L, 3L, 1L, 1L, 2L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 3L, 2L, 3L, 3L, 2L, 3L, 3L, 1L, 1L, 2L, 2L, 
1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L), .Dim = c(15L, 10L))

> M
      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    1    2    2    1    1    3    2    2    1     3
 [2,]    3    2    1    3    3    1    2    3    1     3
 [3,]    1    2    3    2    3    1    2    2    2     1
 [4,]    2    3    1    2    2    2    3    1    2     1
 [5,]    1    1    3    3    3    1    2    2    2     2
 [6,]    3    3    2    3    3    1    2    1    1     2
 [7,]    3    1    2    2    2    1    3    3    1     1
 [8,]    2    1    2    2    3    1    3    3    1     2
 [9,]    2    1    2    2    3    3    3    1    2     3
[10,]    3    1    3    2    1    2    1    2    1     3
[11,]    3    2    2    1    1    1    2    1    3     3
[12,]    1    1    1    2    1    1    2    3    2     3
[13,]    1    1    3    2    1    3    1    2    3     3
[14,]    1    2    2    2    3    3    3    3    3     1
[15,]    2    2    1    2    2    3    3    3    2     3

我使用
dplyr
找到了这个问题的以下答案:

M1 <- M %>% data.frame %>% mutate(sumVar = rowSums(.)) %>% 
  arrange(desc(sumVar)) %>% dplyr::select(-sumVar)
M2 <- M1  %>% as.matrix %>% t %>% data.frame %>% 
  mutate(sumVar = rowSums(.)) %>% arrange(desc(sumVar)) %>% 
  dplyr::select(-sumVar) %>% as.matrix %>% t %>% data.frame %>% 
  arrange_all(funs(desc(.))) 
i <- 1
j <- 1
while(sum(M2[1:i,1:j]) == i*j){
  i <- i+1
  j <- j+1
  M3 <- M2[1:i-1,1:j-1]
}

注意,应该添加更多的函数来保留变量名,并在使用arrange之后找到它们

问得好。你能提供一个可复制的例子吗?我刚才提供了解决方案和例子。谢谢你的建议。与其他语言版本一样,它工作得非常好。然而,我意识到这段代码只检索相邻的1个元素。我需要从整个矩阵中得到一个最大子矩阵,它们不一定彼此相邻。“你能帮我吗?”MohieddinJafari Okey,我明白了。现在你可以查看我的更新了。我发现了这个错误:(l@MohieddinJafari)中的错误,很抱歉我的输入错误…应该是
unique(c(x))
而不是
unique(x)
,现在它已经修复了,谢谢,我想如果我们改变
N
M <- unname(as.matrix(read.csv(file = "test2.csv")))
S <- matrix(0,nrow = nrow(M),ncol = ncol(M))
S[,1] <- M[,1]
for (i in 1:nrow(S)) {
  for (j in 2:ncol(S)) {
    if (M[i,j]==1) {
      if (i==1) {
        S[i,j] <- M[i,j]
      } else {
        S[i,j] <- min(c(S[i,j-1],S[i-1,j],S[i-1,j-1]))+1
      }
    }
  }
}

inds <- which(S == max(S),arr.ind = TRUE)
w <- seq(max(S))-1
res <- lapply(seq(nrow(inds)), function(k) M[inds[k,"row"]-w,inds[k,"col"]-w])
M1 <- M %>% data.frame %>% mutate(sumVar = rowSums(.)) %>% 
  arrange(desc(sumVar)) %>% dplyr::select(-sumVar)
M2 <- M1  %>% as.matrix %>% t %>% data.frame %>% 
  mutate(sumVar = rowSums(.)) %>% arrange(desc(sumVar)) %>% 
  dplyr::select(-sumVar) %>% as.matrix %>% t %>% data.frame %>% 
  arrange_all(funs(desc(.))) 
i <- 1
j <- 1
while(sum(M2[1:i,1:j]) == i*j){
  i <- i+1
  j <- j+1
  M3 <- M2[1:i-1,1:j-1]
}
M <- structure(c(1L, 1L, 1L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
                 1L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), .Dim = c(5L, 
                                                                           5L))
> M
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    1    1    0    1
[2,]    1    1    1    1    1
[3,]    1    1    1    1    1
[4,]    1    1    1    1    1
[5,]    0    1    1    1    1
> M1
  X1 X2 X3 X4 X5
1  1  1  1  1  1
2  1  1  1  1  1
3  1  1  1  1  1
4  1  1  1  0  1
5  0  1  1  1  1
> M2
  X1 X2 X3 X4 X5
1  1  1  1  1  1
2  1  1  1  1  1
3  1  1  1  1  1
4  1  1  1  1  0
5  1  1  1  0  1
> M3
  X1 X2 X3 X4
1  1  1  1  1
2  1  1  1  1
3  1  1  1  1
4  1  1  1  1