如何使用read.csv仅读取与某些正则表达式匹配的行?

如何使用read.csv仅读取与某些正则表达式匹配的行?,r,regex,csv,R,Regex,Csv,我想使用R中的read.csv读取一个大文件。现在获取与某个模式匹配的行的一种方法是首先获取数据帧中的所有行,然后仅过滤所需的行。这种方法的问题是文件太大,并且在某些机器上,所有数据可能无法放入内存。那么,有没有什么方法可以使用grep或类似的工具以及read.csv来获取感兴趣的几行内容呢?您不能使用read.table及其派生工具来实现此目的。但是,您可以使用readLines以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行 另一种选择是使用类似数据库的框架。可以将csv文

我想使用
R
中的
read.csv
读取一个大文件。现在获取与某个模式匹配的行的一种方法是首先获取
数据帧中的所有行,然后仅过滤所需的行。这种方法的问题是文件太大,并且在某些机器上,所有数据可能无法放入内存。那么,有没有什么方法可以使用
grep
或类似的工具以及
read.csv
来获取感兴趣的几行内容呢?

您不能使用
read.table
及其派生工具来实现此目的。但是,您可以使用
readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行


另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。

您不能使用
read.table
及其衍生工具来实现此目的。但是,您可以使用
readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行


另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。

您不能使用
read.table
及其衍生工具来实现此目的。但是,您可以使用
readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行


另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。

您不能使用
read.table
及其衍生工具来实现此目的。但是,您可以使用
readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行


另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。

您可以在shell/终端中使用
grep
(或
awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看
R
中是否有可用的工具,以便使用
read.csv
regex
或类似的工具来执行此操作。您可以从
data.table
fread
使用shell命令。例如,请参见。您可以在shell/终端中使用
grep
(或
awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看
R
中是否有可用的工具,以便使用
read.csv
regex
或类似的工具来执行此操作。您可以从
data.table
fread
使用shell命令。例如,请参见。您可以在shell/终端中使用
grep
(或
awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看
R
中是否有可用的工具,以便使用
read.csv
regex
或类似的工具来执行此操作。您可以从
data.table
fread
使用shell命令。例如,请参见。您可以在shell/终端中使用
grep
(或
awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看
R
中是否有可用的工具,以便使用
read.csv
regex
或类似的工具来执行此操作。您可以从
data.table
fread
使用shell命令。例如,请参见。