使用awk简化文本处理管道
我有以下文本数据(高度简化): 所需输出为:使用awk简化文本处理管道,awk,sed,Awk,Sed,我有以下文本数据(高度简化): 所需输出为: dn: cn=kerberos,cn=schema,cn=config objectClass: olcSchemaConfig cn: kerberos some: properties 为此,我编写了以下shell管道: awk -vRS= -vFS="\n" '/kerberos/{print $0}' /tmp/input.txt | \ sed 's/{0}kerberos/kerberos/' | \ sed '/som
dn: cn=kerberos,cn=schema,cn=config
objectClass: olcSchemaConfig
cn: kerberos
some: properties
为此,我编写了以下shell管道:
awk -vRS= -vFS="\n" '/kerberos/{print $0}' /tmp/input.txt | \
sed 's/{0}kerberos/kerberos/' | \
sed '/some: junk/,$d'
这很好,但我觉得混合awk和sed是“作弊”。如何使用单个awk脚本实现此功能?显然,您只需要一个
sed
命令,而不是两个:
sed -e 's/{0}kerberos/kerberos/' -e '/some: junk/,$d'
除非您坚持使用C shell,否则行末尾的反斜杠是不必要的
您可以在一个sed
命令中完成这一切:
sed -n -e '/kerberos/,/^$/{
s/{0}kerberos/kerberos/
/some: junk/,$d; p;}'
可以在s//
替换后用分号将其展平到一行
sed -n -e '/kerberos/,/^$/{ s/{0}kerberos/kerberos/; /some: junk/,$d; p; }'
Mac OS X(BSD)上的sed
需要}
前面的分号;GNUsed
没有它是幸福的
您也可以在awk
中完成这一切:
awk '/kerberos/,/^$/ { sub(/\{0\}kerberos/,"kerberos");
if ($0 ~ /^some:/ && some++ > 0) next;
if ($0 != "") print
}' input.txt
对于输入数据,它产生:
dn: cn=kerberos,cn=schema,cn=config
objectClass: olcSchemaConfig
cn: kerberos
some: properties
对于我的示例输入,您的脚本工作得很好-实际数据集(在中遇到)需要稍微严格的匹配条件。谢谢你的精彩帖子,这正是我想要的:)这假设在
some:
之后,你有junk
。我认为OP只意味着要删除其他数据。因此,这里我选择的是awk
而不是sed
dn: cn=kerberos,cn=schema,cn=config
objectClass: olcSchemaConfig
cn: kerberos
some: properties