如何从HTML页面grep多行

如何从HTML页面grep多行,html,shell,grep,Html,Shell,Grep,我有一个HTML页面,上面有很多这样的标签 <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> A. A. A. 我需要grep所有这些块单独留下所有其他内容(如一般文本) 我在pcregrep上看到了其他一些帖子,但我并不清楚 有人能帮我使用gr

我有一个HTML页面,上面有很多这样的标签

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>

A.
A.
A.
我需要grep所有这些块单独留下所有其他内容(如一般文本)

我在pcregrep上看到了其他一些帖子,但我并不清楚


有人能帮我使用grep(或任何其他解决方案)吗?

您可以使用
sed
获取所有这些块:

$ sed -n '/<tr>/,/<\/tr>/p' input.html
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>
$sed-n'//,//p'input.html
A.
A.
A.

请参阅我的答案。基本上,您可以使用
grep
s
-z
选项加上一个非常特定的正则表达式。

这将提取第一个和最后一个之间的所有内容。如果OP只需要块,这个解决方案就有问题了。e、 g..…如果
始终在分隔行上,则此命令有效。忘记它。。在注释中引入代码格式真的很难。厌倦了让评论看起来更好。解决这个问题可能比原来的问题更难。。我放弃了。