R:文件的大小。file.info()$size和object.size()之间有什么区别?
我想知道R中文件的大小。我应该使用R:文件的大小。file.info()$size和object.size()之间有什么区别?,r,file-handling,R,File Handling,我想知道R中文件的大小。我应该使用file.info(pathtodata)$size还是object.size(pathtodata) (或其他解决方案?) 它们之间有什么区别 谢谢大家! 通常object.size()应该大于磁盘上的文件大小,因为R对象将具有与其关联的元数据,这些元数据会占用额外的内存-请参阅。除此之外,不同的对象类将具有不同的内存占用: write.csv( matrix(1:1000), file="~/tmp/foo.csv", row.names=FAL
file.info(pathtodata)$size还是object.size(pathtodata)
(或其他解决方案?)
它们之间有什么区别
谢谢大家! 通常
object.size()
应该大于磁盘上的文件大小,因为R对象将具有与其关联的元数据,这些元数据会占用额外的内存-请参阅。除此之外,不同的对象类将具有不同的内存占用:
write.csv(
matrix(1:1000),
file="~/tmp/foo.csv",
row.names=FALSE)
##
df <- read.csv(
"~/tmp/foo.csv",
stringsAsFactors=FALSE)
mat <- as.matrix(df)
##
R> file.info("~/tmp/foo.csv")$size
#[1] 3898
R> object.size(df)
#4672 bytes
R> object.size(mat)
#4464 bytes
R> file.info("~/tmp/foo.csv")$size
#[1] 3898
R> system("stat ~/tmp/foo.csv")
# File: ‘/home/nr07/tmp/foo.csv’
# Size: 3898 Blocks: 8 IO Block: 4096 regular file
write.csv(
矩阵(1:1000),
file=“~/tmp/foo.csv”,
row.names=FALSE)
##
对象大小(df)
#4672字节
R> 对象大小(mat)
#4464字节
R> file.info(“~/tmp/foo.csv”)$size
#[1] 3898
R> 系统(“stat~/tmp/foo.csv”)
#文件:'/home/nr07/tmp/foo.csv'
#大小:3898块:8 IO块:4096常规文件
在上面的示例中,
data.frame
比矩阵
占用更多内存,即使它们是由相同的底层数据构建的;这两个对象都比文件本身在磁盘上占用更多的空间。通常object.size()
应该大于磁盘上文件的大小,因为R对象将具有与它们相关联的元数据,这些元数据会占用额外的内存-请参阅。除此之外,不同的对象类将具有不同的内存占用:
write.csv(
matrix(1:1000),
file="~/tmp/foo.csv",
row.names=FALSE)
##
df <- read.csv(
"~/tmp/foo.csv",
stringsAsFactors=FALSE)
mat <- as.matrix(df)
##
R> file.info("~/tmp/foo.csv")$size
#[1] 3898
R> object.size(df)
#4672 bytes
R> object.size(mat)
#4464 bytes
R> file.info("~/tmp/foo.csv")$size
#[1] 3898
R> system("stat ~/tmp/foo.csv")
# File: ‘/home/nr07/tmp/foo.csv’
# Size: 3898 Blocks: 8 IO Block: 4096 regular file
write.csv(
矩阵(1:1000),
file=“~/tmp/foo.csv”,
row.names=FALSE)
##
对象大小(df)
#4672字节
R> 对象大小(mat)
#4464字节
R> file.info(“~/tmp/foo.csv”)$size
#[1] 3898
R> 系统(“stat~/tmp/foo.csv”)
#文件:'/home/nr07/tmp/foo.csv'
#大小:3898块:8 IO块:4096常规文件
在上面的示例中,
data.frame
比矩阵
占用更多内存,即使它们是由相同的底层数据构建的;这两个文件都比文件本身在磁盘上占用更多的空间。您是在询问存储在硬盘上的文件的大小,还是加载到R时需要的大小?我需要存储在硬盘上的大小。这就是区别吗?据我所知-是的,这就是区别。请注意,如果您将路径作为字符串传递到object.size,那么它告诉您的是字符串在R中占用了多少内存。object.size(“path/to/data”)
是字符串“path/to/data”(120字节)的大小.您是在询问存储在硬盘上的文件大小,还是加载到R时需要的文件大小?我需要存储在硬盘上的文件大小。这就是区别吗?据我所知-是的,这就是区别。请注意,如果将路径作为字符串传递到object.size,那么它告诉您的是字符串在R中占用的内存量。object.size(“path/to/data”)
是字符串“path/to/data”(120字节)的大小。