加载大型文件并计算R中的行和列总和

加载大型文件并计算R中的行和列总和,r,R,我正在尝试将一个巨大的文件加载到R(>30GB) 我尝试运行的命令不仅速度慢,而且还会使ram崩溃: m = read.table("myfile.txt") print("Done reading m") m.row.sums = apply(m,1,sum) write.table(m.row.sums, file = "myfile_rowsums.txt") m.col.sums = apply(m,2,sum) write.table(m.col.sums, file = "myfil

我正在尝试将一个巨大的文件加载到R(>30GB)

我尝试运行的命令不仅速度慢,而且还会使ram崩溃:

m = read.table("myfile.txt")
print("Done reading m")
m.row.sums = apply(m,1,sum)
write.table(m.row.sums, file = "myfile_rowsums.txt")
m.col.sums = apply(m,2,sum)
write.table(m.col.sums, file = "myfile_colsums.txt")
m.sub = m[,which(m.col.sums>1000)]
write.table(m.col.sums, file = "myfile_sub.txt")

是否有一种更高效(更快)的方法来实现R中的相同功能?

顺便说一句,您可以使用
行和
/
列和
而不是
应用(m,1,sum)
/
应用(m,2,sum)
。R没有真正的管道功能。。。所以如果你的内存用完了,你不能删除任何变量,那么你就不走运了。。。(据我所知)