如何使用bash命令删除html标记中的空格

如何使用bash命令删除html标记中的空格,bash,Bash,我的html解析器程序有问题。我的html中的标签写得像和:空白给我带来了问题 是否有一种简单的方法可以使用类似于singlebash命令中的sed来删除这些空格?这里有一种方法可以修剪无属性标记中的前导空格和尾随空格 $ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g' <p> </p> <p>

我的html解析器程序有问题。我的html中的标签写得像
:空白给我带来了问题


是否有一种简单的方法可以使用类似于singlebash命令中的sed来删除这些空格?

这里有一种方法可以修剪无属性标记中的前导空格和尾随空格

$ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g'
<p> </p> <p> </p>
$echo''|sed-E's |]*)*>|g'


不,有太多的边缘情况,引号和转义字符会破坏结果。对于你得到的每一个答案,都很容易找到打破它们的例子。查看完整的讨论。

然后可以随意按下ol'check按钮,该按钮的信誉低于15,用户无法投票(所以我为他做了)。