Linux 为管道外循环创建AWK命令_Linux_Bash_Awk

Linux 为管道外循环创建AWK命令

linux bash awk

Linux 为管道外循环创建AWK命令,linux,bash,awk,Linux,Bash,Awk,下面的命令正是我所需要的它检查列中是否存在字符串，如果不存在，则添加逗号 awk -F, -v OFS=, '!/Reading Comprehension/ { $5 = $5 "," } 1' somefile.csv \ | awk -F, -v OFS=, '!/Sentence Skills/ { $6 = $6 "," } 1' \ | awk -F, -v OFS=, '!/Arithmetic/ { $7 = $7 "," } 1' \ | awk -F, -v OFS=, '

下面的命令正是我所需要的它检查列中是否存在字符串，如果不存在，则添加逗号

awk -F, -v OFS=, '!/Reading Comprehension/ { $5 = $5 "," } 1' somefile.csv \
| awk -F, -v OFS=, '!/Sentence Skills/ { $6 = $6 "," } 1' \
| awk -F, -v OFS=, '!/Arithmetic/ { $7 = $7 "," } 1' \
| awk -F, -v OFS=, '!/College Level Math/ { $8 = $8 "," } 1' \
| awk -F, -v OFS=, '!/Elementary Algebra/ { $9 = $9 "," } 1' > endfile.csv

如何将此连接/管道命令转换为awk循环

我是这样想的：

awk -F, OFS=,
i = Reading Comprehension, Sentence Skills, Arithmetic, College Level Math, Elementary Algebra 
j = 5,6,7,8,9
{for ((i<=NF; j<=NF) '!/i/ { $j = $j "," } 1')}

样本输出：

last,first,A00XXXXXX,1888-01-01,2015-05-13,,,,,Elementary Algebra 34
last,first,A00XXXXXX,1888-01-01,2015-05-13,Reading Comprehension 97,Sentence Skills 104,Arithmetic 08,College Level Math 76,Elementary Algebra 115
last,first,A00XXXXXX,1888-01-01,2015-05-13,,Sentence Skills 104,,College Level Math 76,Elementary Algebra 115
last,first,A00XXXXXX,1888-01-01,2015-05-13,,,,College Level Math 76,Elementary Algebra 115
last,first,A00XXXXXX,1888-01-01,2015-05-13,,Sentence Skills 104,,,Elementary Algebra 115

我仍在学习AWK，对如何进行AWK循环只有部分了解

如果您能提供任何帮助，我们将不胜感激，并对答案进行解释，这真是太棒了。

您可以执行以下操作，但由于我们正在更改每一列缺失的NF，因此需要一些awk数组舞蹈

BEGIN 
{
   FS=OFS=","
   n=split("Reading Comprehension,Sentence Skills,Arithmetic,College Level Math,Elementary Algebra",c,",")
}

{
   delete a;
   for (i=6;i<=NF;i++) {
     for (j=1;j<=n;j++) {
       if ($i ~ c[j]) a[j]=$i
     }
   }

   print $1,$2,$3,$4,$5,a[1],a[2],a[3],a[4],a[5]
}

此答案假设每个类别中的第一个单词都是唯一的：

awk -F, -v OFS=, '
    {
        delete val                 # clear the previous values if any
        for (i=6; i<=NF; i++) {
            split($i, a, " ")
            val[a[1]] = $i         # a[1] is the first space-separated word
        }
        print $1,$2,$3,$4,$5, val["Reading"],    # null values are OK
                              val["Sentence"], 
                              val["Arithmetic"], 
                              val["College"], 
                              val["Elementary"]
    }
' input

最好发布一些示例输入/所需输出。关于代码本身，管道awk 5次似乎太多了。注意，您可以说awk'/condition/{do things}/condition2/{do other things}'file@fedorqui谢谢，我也在考虑这样做，但仍然给我留下了一个超长的命令。我试图找到最有效的方法来做这件事，并且最容易阅读视觉上很美。管道意味着一遍又一遍地检查所有数据。再次：发布一些数据，以便我们进行进一步检查。看起来像是在逗号分隔的文件中添加逗号，但不确定是否准确how@fedorqui我添加了示例输入和输出，正如我提到的，管道命令正是我所需要的。我只是想把它弄干净一点。我理解上面的部分，也理解下面的部分。但是你能详细说明一下IF部分和最后的打印内容吗？感谢数组a将保持列的位置。对于相关字段i>=6，它扫描存储在c中的名称，如果匹配项放在正确的位置。所有字段用完后，打印第一个静态列和数组元素。a的某些元素不会被初始化，它们是缺少的元素，但会被打印为空字符串，这样每行的字段数就相同了。@glenn jackman有点麻烦了。在我解析文件的地方，只需更改文件的顺序…基本上没有顺序。你知道如何按照我在问题中提到的顺序排列它们吗，即使最后5列的每一行的顺序不同？我会的d@mmed，你的脚本不在乎它的顺序……我希望我能吻你。@moore1emu，输出顺序在print语句中定义。

awk -F, -v OFS=, '
    {
        delete val                 # clear the previous values if any
        for (i=6; i<=NF; i++) {
            split($i, a, " ")
            val[a[1]] = $i         # a[1] is the first space-separated word
        }
        print $1,$2,$3,$4,$5, val["Reading"],    # null values are OK
                              val["Sentence"], 
                              val["Arithmetic"], 
                              val["College"], 
                              val["Elementary"]
    }
' input