Regex xml标记内的sed正则表达式

Regex xml标记内的sed正则表达式,regex,bash,sed,Regex,Bash,Sed,我正试图用sed清理一些XML。我有一个很大的XML文件,里面有很多数据,包括地址细节。地址详细信息在标记中。由于某些原因,系统通常使用正则表达式,其强度不足以解析XML或HTML。问题是,HTML/XML比正则表达式更为复杂,因为它在不同的层次上都是相同的 对于此任务,您应该使用更复杂的工具,例如Python或与Python一起使用 关于该主题的进一步阅读: 在大多数情况下,不应该使用正则表达式来解析HTML/XML。最好使用专用的xml解析器 <Address> <line

我正试图用sed清理一些XML。我有一个很大的XML文件,里面有很多数据,包括地址细节。地址详细信息在标记中。由于某些原因,系统通常使用正则表达式,其强度不足以解析XML或HTML。问题是,HTML/XML比正则表达式更为复杂,因为它在不同的层次上都是相同的

对于此任务,您应该使用更复杂的工具,例如Python或与Python一起使用

关于该主题的进一步阅读:


在大多数情况下,不应该使用正则表达式来解析HTML/XML。最好使用专用的xml解析器
<Address>
<line>123 & GRD FLOOR <REAR</line><line>59 EXAMPLE RD</line>    <line>CITY</line><line></line><line></line><line>RG1 1AB</line>
</Address>

<Address>
<line>SECOND GRD FLOOR <FRONT></line><line>59 EXAMPLE RD</line><line>CITY</line><line></line><line></line><line>RG1 1AB</line>
</Address>

<Address>
<line>123 & GRD <REAR> FLOOR</line><line>59 EXAMPLE RD</line><line>CITY</line><line></line><line></line><line>RG1 1AB</line>
</Address>
sed 's/ *$//g'; 's/ *#//g'; 's/&/&amp;/g'; 's/</&lt;/g';'s/>/&gt;/g'