Awk 局部爆炸的长度选项

Awk 局部爆炸的长度选项,awk,blast,Awk,Blast,我有一个相对较大的blastn输出文件。由于没有指定查询序列的最小核苷酸长度的选项,我的想法是在blast运行之后使用awk搜索它 该文件的一个示例如下: > abc Length=4553119 Score = 273 bits (302), Expect = 3e-74 Identities = 151/151 (100%), Gaps = 0/151 (0%) Strand=Plus/Plus Query 1 CCCACATCGAACTCGACGGTGAC

我有一个相对较大的blastn输出文件。由于没有指定查询序列的最小核苷酸长度的选项,我的想法是在blast运行之后使用awk搜索它

该文件的一个示例如下:

> abc
Length=4553119

 Score = 273 bits (302),  Expect = 3e-74
 Identities = 151/151 (100%), Gaps = 0/151 (0%)
 Strand=Plus/Plus

Query  1        CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  60
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297151  CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  4297210

Query  61       TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  120
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297211  TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  4297270

Query  121      TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  151
                |||||||||||||||||||||||||||||||
Sbjct  4297271  TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  4297301


 Score = 28.3 bits (30),  Expect = 1.7
 Identities = 15/15 (100%), Gaps = 0/15 (0%)
 Strand=Plus/Minus

Query  97     GGCTGCATCGCCAGG  111
              |||||||||||||||
Sbjct  63261  GGCTGCATCGCCAGG  63247
使用awk,我正在搜索包含
标识=[>=50]

awk 'Identities =  >= 50'
我不关心这行的其余部分(从
/151(100%)
开始)


但是我得到了一个语法错误,那么如何将“大于等于”放在其中呢?

很抱歉不清楚,我想要一个大于50的值,14只是一个例子;我想要所有带50/[xx]的字符串抱歉,当您说
我不关心行的其余部分(从/151(100%)开始)时,我相应地更改了我的问题。
您的意思是不希望它作为输入比较的一部分进行测试,还是不希望它作为输出的一部分打印,或者两者都打印,或者其他什么?您的问题将显示准确的预期输出,以帮助澄清。英语要求是有用的,但含糊不清-完整的具体例子是非常必要的!好的,实际上我解决这个问题的想法和你建议的不同。。。无论如何,我的最终目标是使用此搜索模式并打印第5行(从
标识
行开始计算,因此以
Sbjct
开头的行),如果满足条件(>=50),请在问题中说明您实际使用Compile做了什么,可测试的样本输入和预期输出,如果要打印以
Sbjct
开头的行或
identification
之后的5行,或者如果两个标准中的任何一个都起作用,或者其他什么,请务必清楚。如果你能清楚地说明你想要的是什么,听起来你想要的可能是绝对微不足道的。
$ awk '/Identities =/ && ($3+0)>=50' file
 Identities = 151/151 (100%), Gaps = 0/151 (0%)