etree解析包含转义html的xml
我有一个包含转义html的xml文件,字段如下所示:etree解析包含转义html的xml,html,xml,elementtree,Html,Xml,Elementtree,我有一个包含转义html的xml文件,字段如下所示: 一些带有html i的记录标题这应该在转义的html/i中,标题的末尾 我发现这个元素很好: el = titles.find("x:title", NS) 但当我这样做的时候: el.text 它返回带有非转义标记的文本: “某些带有html的记录标题应在转义html中;,标题结尾“ 为什么会这样?即使提供了转义,我也必须再次单独转义html标记吗?我希望能够为xml提供转义和非转义html标记(有时显示为文本,有时显
一些带有html i的记录标题这应该在转义的html/i中,标题的末尾
我发现这个元素很好:
el = titles.find("x:title", NS)
但当我这样做的时候:
el.text
它返回带有非转义标记的文本:
“某些带有html的记录标题应在转义html中;,标题结尾“
为什么会这样?即使提供了转义,我也必须再次单独转义html标记吗?我希望能够为xml提供转义和非转义html标记(有时显示为文本,有时显示为格式化文本)。如何正确提供它?在使用ElementTree函数时
\u escape\u attrib()
可以使用:
import xml.etree.ElementTree as ET
text = '''<title>Some records title with html <i> This should be inside escaped html </i>, end of the title</title>
'''
root = ET.fromstring(text)
print(ET._escape_attrib(root.text))
将xml.etree.ElementTree作为ET导入
text=''一些带有html i的记录标题这应该在转义的html/i中,标题的末尾
'''
root=ET.fromstring(文本)
打印(ET._escape_attrib(root.text))
这将输出带有html i的一些记录标题,这应该在转义的html/i中,标题的末尾