如何使用read.csv仅读取与某些正则表达式匹配的行?
我想使用如何使用read.csv仅读取与某些正则表达式匹配的行?,r,regex,csv,R,Regex,Csv,我想使用R中的read.csv读取一个大文件。现在获取与某个模式匹配的行的一种方法是首先获取数据帧中的所有行,然后仅过滤所需的行。这种方法的问题是文件太大,并且在某些机器上,所有数据可能无法放入内存。那么,有没有什么方法可以使用grep或类似的工具以及read.csv来获取感兴趣的几行内容呢?您不能使用read.table及其派生工具来实现此目的。但是,您可以使用readLines以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行 另一种选择是使用类似数据库的框架。可以将csv文
R
中的read.csv
读取一个大文件。现在获取与某个模式匹配的行的一种方法是首先获取数据帧中的所有行,然后仅过滤所需的行。这种方法的问题是文件太大,并且在某些机器上,所有数据可能无法放入内存。那么,有没有什么方法可以使用grep
或类似的工具以及read.csv
来获取感兴趣的几行内容呢?您不能使用read.table
及其派生工具来实现此目的。但是,您可以使用readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行
另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。您不能使用read.table
及其衍生工具来实现此目的。但是,您可以使用readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行
另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。您不能使用read.table
及其衍生工具来实现此目的。但是,您可以使用readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行
另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。您不能使用read.table
及其衍生工具来实现此目的。但是,您可以使用readLines
以块的形式读入数据,并将正则表达式应用于每个元素,每个元素对应一行
另一种选择是使用类似数据库的框架。可以将csv文件读入SQL数据库。您可以使用SQL查询只读取所需的行。您可以在shell/终端中使用grep
(或awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看R
中是否有可用的工具,以便使用read.csv
和regex
或类似的工具来执行此操作。您可以从data.table
对fread
使用shell命令。例如,请参见。您可以在shell/终端中使用grep
(或awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看R
中是否有可用的工具,以便使用read.csv
和regex
或类似的工具来执行此操作。您可以从data.table
对fread
使用shell命令。例如,请参见。您可以在shell/终端中使用grep
(或awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看R
中是否有可用的工具,以便使用read.csv
和regex
或类似的工具来执行此操作。您可以从data.table
对fread
使用shell命令。例如,请参见。您可以在shell/终端中使用grep
(或awk
)过滤掉某些行,发送到新文件,然后将该文件读入R。否则,您可以按块读取数据,然后过滤块感谢您的帮助@RichardScriven。我正在查看R
中是否有可用的工具,以便使用read.csv
和regex
或类似的工具来执行此操作。您可以从data.table
对fread
使用shell命令。例如,请参见。