Html 如何处理这个字符串?

Html 如何处理这个字符串?,html,linux,sed,Html,Linux,Sed,我有一个包含如下文本的html文件: <p>يورونيوز: <br /> &#8220; يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . &#8220; </p> “ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “

我有一个包含如下文本的html文件:

<p>يورونيوز: <br />
&#8220; يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . &#8220; </p>

“ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “ 

现在我想删除
并将两行连接成一行。我该怎么做?我必须提到的是,“用于双引号,我在连接后替换它。 我使用了此代码,但它不起作用:

sed -i -e '/<br \/>[ \r\t\n]+/d' 1.html
sed-i-e'/[\r\t\n]+/d'1.html

sed
逐行读取内容,因此不能仅删除“\n”字符。默认情况下,sed不可见该字符。 您需要先读取将下一行追加到模式空间,然后才能删除
\n
字符:

sed-e'/[\s]+$/{N;d}'1.html


有一件事我不明白:您是否要删除带有

的行和下一行?如果是这样,上面的代码是正确的。

拉什正确地说出了代码不起作用的原因;此版本符合您的要求

sed -i '/<br \/>\s*$/{N;s/<br \/>\s*//}' 1.html
sed-i'/\s*$/{N;s/\s*/}1.html