Linux 从csv输出特定行_Linux_Csv_Sed_Awk_Grep

Linux 从csv输出特定行

linux csv sed awk grep

Linux 从csv输出特定行,linux,csv,sed,awk,grep,Linux,Csv,Sed,Awk,Grep,我有一个非常大（500mb）的csv文件和另一个文本文件，每行包含一个单词当我在csv的文本文件中找到一个单词时，我想输出该行（将输出重定向到一个文件）。我有一个使用grep-iE（word1 | word2 | word3 |…| wordn）的grep解决方案，但它在使用带有segfault的16gb内存后崩溃，只提取了很少的条目我尝试了csvtool，但它拒绝产生任何有价值的东西该解决方案必须在linux下工作，并且最好不占用内存。使用awk。首先处理每行一个字的文件，将其数据保存在

我有一个非常大（500mb）的csv文件和另一个文本文件，每行包含一个单词

当我在csv的文本文件中找到一个单词时，我想输出该行（将输出重定向到一个文件）。我有一个使用grep-iE（word1 | word2 | word3 |…| wordn）的grep解决方案，但它在使用带有segfault的16gb内存后崩溃，只提取了很少的条目
我尝试了csvtool，但它拒绝产生任何有价值的东西

该解决方案必须在linux下工作，并且最好不占用内存。
使用
awk
。首先处理每行一个字的文件，将其数据保存在数组中，对于第二个文件，使用表达式if（数组中的列）检查特定列：

awk ' BEGIN { FS = OFS = ","; } FNR == NR { data[ $1 ] = 1; next; } FNR < NR { if ( $4 in data ) { print $0; } } ' textfile large_csv_file

awk' 开始{ FS=OFS=“，”； } FNR==NR{ 数据[$1]=1；下一个 } FNR
使用
awk
。首先处理每行一个字的文件，将其数据保存在数组中，对于第二个文件，使用表达式if（数组中的列）检查特定列：

awk ' BEGIN { FS = OFS = ","; } FNR == NR { data[ $1 ] = 1; next; } FNR < NR { if ( $4 in data ) { print $0; } } ' textfile large_csv_file

awk' 开始{ FS=OFS=“，”； } FNR==NR{ 数据[$1]=1；下一个 } FNR
对不起，我从未使用过awk。在哪里指定要检查的列？我的猜测是if（$4在数据中）{。是$4是列号吗？如果是，它是从列0开始的零索引吗？@Birei工作起来，速度非常快。一个小错误：我必须使用NF>1而不是FNR1而不是FNR

[csv]相关文章推荐

使用Coldfusion 10解密gpg4Win加密的CSV csv encryption coldfusion

我试图使用csv文件中的列值填充图形（svg元素）中条形图的颜色，但不起作用 csv svg d3.js

如何从JMeter生成的csv文件计算平均响应时间？ csv time jmeter

Csv 在Google工作表中解析选项卡分隔的文本文件 csv google-sheets

Csv 如何修复使用子目录时的文件访问？ csv go directory

Csv 如何从文本文件中删除特定范围的字符？ csv text notepad++

Csv 将动态文件名复制到具有日期的其他目录的批处理文件 csv batch-file

F#读取压缩的csv文件 csv f#

Csv 为使用powershell的ADDS 2008 R2上的用户设置HomeDirectory参数 csv powershell scripting active-directory

Logastash CSV过滤器|转换 csv logstash

Csv sphinx latexpdf从rst生成的pdf格式的丑陋、破碎的表格 csv python-sphinx

Deedle-如何使用'；ParseExact'；在Frame.ReadCsv架构中 csv parsing f#

使用哈希数据类型将csv导入redis csv ubuntu awk redis

带倍频程的CSV盒n晶须 csv octave

如何使用writerow将带有时间戳的整数流写入.csv文件？ csv arduino

SAS将数据集导出为csv或excel，保留换行符 csv sas

如何在不上传CSV文件的情况下读取CSV文件的内容 csv angular6

Csv 如何在不同列中分隔逗号分隔的值，同时在Google工作表中保留行的其余部分中的值？ csv google-sheets

避免在读取csv中读取多索引 csv

Csv 如何创建一个文件头和不同的变量在八度？ csv file octave

随机文章推荐

Xamarin.android 单机器人GREF问题最佳实践？ xamarin.android

Xamarin.android 安装Mono Droid framework平台时出错 xamarin.android

Xamarin.android 如何在xmarin droid上设置超时wcf xamarin.android

Xamarin.android MVxRadioGroup SelectedIndexBinding xamarin.android

Xamarin.android 在mono android中将图像从页面导航到其他页面 xamarin.android

Xamarin.android Xamarin表单-Salesforce-TLS 1.1或TLS 1.2。Android的POST API调用出错 xamarin.android xamarin.forms

Xamarin.android Android类型或名称空间名称'；选位器'；找不到 xamarin.android

crud使用azure服务在xamarin.android中进行在线-离线同步 xamarin.android azure-sql-database

Xamarin.android Visual Studio 15.6不再支持Xamarin组件 xamarin.android visual-studio-2017

Xamarin.android 使用命令行在Xamarin评测中触发快照 xamarin.android

Xamarin.android IsNullOrEmtpy没有响应，应用程序使我崩溃 xamarin.android

Xamarin.android 如何用资产中文件的标题填充列表视图？ xamarin.android

Xamarin.android 为什么应用程序没有'；不要等待用户的回答？ xamarin.android

Xamarin.android 使用Zebra MX extensions AppManager时出错 xamarin.android

Xamarin.android OnCreateContextMenu不使用webview xamarin.android

xamarin.android中资源目录的路径 xamarin.android