Python 使用lxml合并两个段落中的HTML内容
我想把两个段落中的所有内容合并成一个段落,中间留一个空格。我如何使用lxml实现这一点 例如:Python 使用lxml合并两个段落中的HTML内容,python,html,lxml,Python,Html,Lxml,我想把两个段落中的所有内容合并成一个段落,中间留一个空格。我如何使用lxml实现这一点 例如: <p>He is <b>bold</b>!</p> <p>Is he <u>here</u>?</p> 他很大胆 他在吗 将合并为: <p>He is <b>bold</b>! Is he <u>here</u>?</p> 他很大
<p>He is <b>bold</b>!</p>
<p>Is he <u>here</u>?</p>
他很大胆
他在吗
将合并为:
<p>He is <b>bold</b>! Is he <u>here</u>?</p>
他很大胆!他在吗
如果您的结构很简单,这可能会起到以下作用:
导入lxml
从lxml导入etree
root=etree.fromstring(“”)
first=etree.fromstring(“他是粗体的!”)
second=etree.fromstring(“他在吗?”)
尝试:
first.getchildren()[-1].tail+=''+second.text
除索引器外:
first.text+=''+second.text
root.append(第一个)
对于第二个中的子项。getchildren()
root.append(子级)
etree.tostring(根目录)