Python 如何在xml.minidom中获取元素的全文?

Python 如何在xml.minidom中获取元素的全文?,python,minidom,Python,Minidom,我想得到一个元素的整个文本来解析一些xhtml: <div id='asd'> <pre>skdsk</pre> </div> from xml.dom.minidom import parse, parseString tree = parseString("<div id='asd'><pre>skdsk</pre></div>") root = tree.firstChild node =

我想得到一个元素的整个文本来解析一些xhtml:

<div id='asd'>
  <pre>skdsk</pre>
</div>
from xml.dom.minidom import parse, parseString
tree = parseString("<div id='asd'><pre>skdsk</pre></div>")
root = tree.firstChild
node = root.childNodes[0]
print node.toxml()

skdsk
在上面的例子中,开始E=div元素,我想得到

skdsk
怎么做?

严格来说:

从xml.dom.minidom导入解析,解析字符串
tree=parseString(“skdsk”)
root=tree.firstChild
node=root.childNodes[0]
打印节点toxml()
但实际上,我还是建议你去图书馆看看。在xhtml文档中找到正确的子节点并跳过“空白节点”是一件痛苦的事情。BeautifulSoup是一个强大的html/xhtml解析器,具有奇妙的树搜索功能

编辑:上面的示例将HTML压缩为一个字符串。如果您像问题中那样使用HTML,换行符等将生成“空白”节点,因此您想要的节点不会位于childNodes[0]

from xml.dom.minidom import parse, parseString
tree = parseString("<div id='asd'><pre>skdsk</pre></div>")
root = tree.firstChild
node = root.childNodes[0]
print node.toxml()