为什么R使我的CSV文件变大?

为什么R使我的CSV文件变大?,r,csv,R,Csv,我正试图读入一系列CSV文件,并为以后的附加做准备。在附加它们之前,我需要创建一个列,告诉我它们来自哪个原始文件。在这种情况下,它们是业务部门。我目前正在使用数字代码来减少文件大小的增加量 我的文件大小从读CSV到写CSV有了很大的飞跃。如果不添加“分区”列(在下面注释掉),我的文件大小将按如下方式增加: 19111KB至24458KB;71331KB至89989KB;33919KB至42898KB 有人能解释一下吗?有没有改进代码的方法 谢谢 insert.division <- fun

我正试图读入一系列CSV文件,并为以后的附加做准备。在附加它们之前,我需要创建一个列,告诉我它们来自哪个原始文件。在这种情况下,它们是业务部门。我目前正在使用数字代码来减少文件大小的增加量

我的文件大小从读CSV到写CSV有了很大的飞跃。如果不添加“分区”列(在下面注释掉),我的文件大小将按如下方式增加:

19111KB至24458KB;71331KB至89989KB;33919KB至42898KB

有人能解释一下吗?有没有改进代码的方法

谢谢

insert.division <- function(fileroot, divisionname){

    ext <- ".csv"
    file <- paste(fileroot, ext, sep = "")
    data <- read.csv(file, header = TRUE, stringsAsFactors = FALSE)
    #data$division <- divisionname
    write.csv(data, file = paste(fileroot, "_adj3", ext, sep = ""),
        row.names = FALSE)

}

files <- c(
    "file1",
    "file2",
    "file3",
    "file4",
    "file5"
)

divisions <- c(1:5)

mapply(insert.division, fileroot = files, divisionname = divisions)

insert.division原因似乎是write.csv在所有字符串周围添加了引号,而Excel仅对包含逗号的字符串使用引号。更多信息:

使用文本编辑器比较输入和输出文件。我有一些想法,但这里没有可复制的例子。@Roland:谢谢你的建议。这似乎是一个在所有字符串周围添加双引号的问题,同时也添加了NA。有办法解决这个问题吗?或者当我合并CSV时,它不会影响性能?