如何从HTML页面grep多行
我有一个HTML页面,上面有很多这样的标签如何从HTML页面grep多行,html,shell,grep,Html,Shell,Grep,我有一个HTML页面,上面有很多这样的标签 <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> <tr> <td> a </td> </tr> A. A. A. 我需要grep所有这些块单独留下所有其他内容(如一般文本) 我在pcregrep上看到了其他一些帖子,但我并不清楚 有人能帮我使用gr
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
A.
A.
A.
我需要grep所有这些块单独留下所有其他内容(如一般文本)
我在pcregrep上看到了其他一些帖子,但我并不清楚
有人能帮我使用grep(或任何其他解决方案)吗?您可以使用
sed
获取所有这些块:
$ sed -n '/<tr>/,/<\/tr>/p' input.html
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
<tr>
<td> a </td>
</tr>
$sed-n'//,//p'input.html
A.
A.
A.
请参阅我的答案。基本上,您可以使用grep
s-z
选项加上一个非常特定的正则表达式。这将提取第一个和最后一个之间的所有内容。如果OP只需要块,这个解决方案就有问题了。e、 g..…如果
和
始终在分隔行上,则此命令有效。忘记它。。在注释中引入代码格式真的很难。厌倦了让评论看起来更好。解决这个问题可能比原来的问题更难。。我放弃了。