Python 获取所有子节点';当前节点的值
我正在尝试检索div中的所有值。 例如:Python 获取所有子节点';当前节点的值,python,Python,我正在尝试检索div中的所有值。 例如: <div>xyz <span> abc </span> def</div> xyz abc def 这是密码 the_page="<div>xyz <span> abc </span> def</div>" doc = libxml2dom.parseString(the_page, html=1) divs=doc.getElementsByTagNam
<div>xyz <span> abc </span> def</div>
xyz abc def
这是密码
the_page="<div>xyz <span> abc </span> def</div>"
doc = libxml2dom.parseString(the_page, html=1)
divs=doc.getElementsByTagName("div")
print divs[0].firstChild.nodeValue
页面=“xyz abc def”
doc=libxml2dom.parseString(_页面,html=1)
divs=doc.getElementsByTagName(“div”)
打印divs[0]。firstChild.nodeValue
这只打印“xyz”。我试图只打印divs[0].nodeValue,但这给了我一个错误。
我想要所有的文本。我该如何解决这个问题?对于您的:
divs=doc.getElementsByTagName("div")
使用:
然后,你可以爬它们。每个子对象都包含一个子对象和节点值列表
for child in childs :
if child.childNode == []:
print child.nodeValue
else :
## Recurse
请注意:
divs=doc.getElementsByTagName("div")
使用:
然后,你可以爬它们。每个子对象都包含一个子对象和节点值列表
for child in childs :
if child.childNode == []:
print child.nodeValue
else :
## Recurse
请使用返回错误值的Python源代码扩展您的问题。所谓“值”是指节点还是文本?如果您在这里没有得到答案,请询问libxml2dom的作者。请在此处查看他的电子邮件地址:感谢使用textContent Worked请使用返回错误值的Python源代码扩展您的问题。所说的“值”是指节点还是文本?如果您在此处没有得到答案,请询问libxml2dom的作者。在这里查看他的电子邮件地址:谢谢使用文本内容