如何从HTML页面grep多行_Html_Shell_Grep

如何从HTML页面grep多行

html shell grep

如何从HTML页面grep多行,html,shell,grep,Html,Shell,Grep,我有一个HTML页面，上面有很多这样的标签 <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> A. A. A. 我需要grep所有这些块单独留下所有其他内容（如一般文本）我在pcregrep上看到了其他一些帖子，但我并不清楚有人能帮我使用gr

我有一个HTML页面，上面有很多这样的标签

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>


A.
A.
A.

我需要grep所有这些块单独留下所有其他内容（如一般文本）

我在pcregrep上看到了其他一些帖子，但我并不清楚

有人能帮我使用grep（或任何其他解决方案）吗？

您可以使用

sed

获取所有这些块：

$ sed -n '/<tr>/,/<\/tr>/p' input.html
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>

$sed-n'//，//p'input.html
A.
A.
A.

请参阅我的答案。基本上，您可以使用

grep

-z

选项加上一个非常特定的正则表达式。

这将提取第一个和最后一个之间的所有内容。如果OP只需要块，这个解决方案就有问题了。e、 g..…如果

和

始终在分隔行上，则此命令有效。忘记它。。在注释中引入代码格式真的很难。厌倦了让评论看起来更好。解决这个问题可能比原来的问题更难。。我放弃了。