Awk grep文件中的多个模式
我在NCBI上运行了BLAST搜索,并将结果下载为xml文件。从这个文件中,我需要物种名称及其相应的序列 物种名称有Awk grep文件中的多个模式,awk,grep,Awk,Grep,我在NCBI上运行了BLAST搜索,并将结果下载为xml文件。从这个文件中,我需要物种名称及其相应的序列 物种名称有作为模式,而匹配序列有作为模式,但两者都用一些线分隔。有没有办法将grep(或awk)后接,这样它就把两条线连接起来,并为我提供每个物种的信息 正如所建议的,我将包括一个实际输入文件的示例- 蛋白质名称[智人] BAG72649 2004 1 蛋白质序列 我期望的结果是- 蛋白质名称[智人] 蛋白质序列 蛋白质名称[小家鼠] 蛋白质序列 提前感谢。$grep'\(\\\\)'文
作为模式,而匹配序列有
作为模式,但两者都用一些线分隔。有没有办法将grep
(或awk
)
后接
,这样它就把两条线连接起来,并为我提供每个物种的信息
正如所建议的,我将包括一个实际输入文件的示例-
蛋白质名称[智人]
BAG72649
2004
1
蛋白质序列
我期望的结果是-
蛋白质名称[智人]
蛋白质序列
蛋白质名称[小家鼠]
蛋白质序列
提前感谢。$grep'\(\\\\)'文件
$ grep '\(<Hit_def>\|<Hsp_qseq>\)' file
<Hit_def> protein name [Homo sapiens] </Hit_def>
<Hsp_qseq> protein sequence </Hsp_qseq>
蛋白质名称[智人]
蛋白质序列
解释:
使用grep
grep
围绕模式的单引号(除非需要shell扩展)”
BRE(基本正则表达式,与\(
中的扩展正则表达式相反)需要转义分组字符grep-E
以及OR运算符()
,
您需要的关键字
蛋白质名称[智人]蛋白质序列
谢谢您的帮助。请用code标签编辑您的帖子,以便所有人都能了解您的要求。我已经添加了所有的code标签我觉得这是需要的。你能指定你需要代码标签的地方吗?谢谢。我们关心的是你应该把你在上面评论中输入的示例输入放在你在代码标签中的帖子中。所以通常任何示例输入/命令/代码都应该用代码标签覆盖。非常感谢,James。这正是我想要的。