Html 如何处理这个字符串?
我有一个包含如下文本的html文件:Html 如何处理这个字符串?,html,linux,sed,Html,Linux,Sed,我有一个包含如下文本的html文件: <p>يورونيوز: <br /> “ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “ </p> “ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “
<p>يورونيوز: <br />
“ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “ </p>
“ يقال إن للقمر تأثير كبير على نمو المزروعات، وأزهار الحدائق وخاصة النبيذ . “
现在我想删除并将两行连接成一行。我该怎么做?我必须提到的是,“用于双引号,我在连接后替换它。 我使用了此代码,但它不起作用:
sed -i -e '/<br \/>[ \r\t\n]+/d' 1.html
sed-i-e'/
[\r\t\n]+/d'1.html
sed
逐行读取内容,因此不能仅删除“\n”字符。默认情况下,sed不可见该字符。
您需要先读取将下一行追加到模式空间,然后才能删除\n
字符:
sed-e'/[\s]+$/{N;d}'1.html
有一件事我不明白:您是否要删除带有
的行和下一行?如果是这样,上面的代码是正确的。拉什正确地说出了代码不起作用的原因;此版本符合您的要求
sed -i '/<br \/>\s*$/{N;s/<br \/>\s*//}' 1.html
sed-i'/
\s*$/{N;s/
\s*/}1.html