如何从R中的大型固定宽度文件中读取特定列

如何从R中的大型固定宽度文件中读取特定列,r,R,在R中是否有任何方便的方法可以从固定宽度的数据文件中读取特定列(或多列)?例如,该文件如下所示: 10010100100002000000 00010010000001000000 10010000001002000000 比如说,我会对第15栏感兴趣。目前,我正在使用read.fwf读取整个数据,宽度为1的向量,长度为总列数: data <- read.fwf("demo.asc", widths=rep(1,20)) data[,14] [1] 2 1 2 data您可以使用连接并

在R中是否有任何方便的方法可以从固定宽度的数据文件中读取特定列(或多列)?例如,该文件如下所示:

10010100100002000000
00010010000001000000
10010000001002000000
比如说,我会对第15栏感兴趣。目前,我正在使用read.fwf读取整个数据,宽度为1的向量,长度为总列数:

data <- read.fwf("demo.asc", widths=rep(1,20))
data[,14]
[1] 2 1 2

data您可以使用连接并分块处理文件:

复制您的数据:

dat <-"10010100100002000000
00010010000001000000
10010000001002000000"

您是否检查了第二个
?read.fwf
示例中
width
参数的使用情况?@Henrik负宽度值?是的,我已经看过了,但是如果有多个列(首先排序,然后计算跳过,等等),这将非常复杂
# Define a connection
con = textConnection(dat)


# Do the block update
linesPerUpdate <- 2
result <- character()
repeat {
  line <- readLines(con, linesPerUpdate)
  result <- c(result, substr(line, start=14, stop=14))
  if (length(line) < linesPerUpdate) break
}

# Close the connection
close(con)
result
[1] "2" "1" "2"