Python 浏览lxml类别

Python 浏览lxml类别,python,graph,lxml,Python,Graph,Lxml,我有一个网页解析程序,现在我想浏览标签,或者显示一个图表。 我怎样才能得到一张图表?或者在树中导航。展示第一步,然后是其他步骤,等等,并了解树是如何建造的 import urllib from lxml import etree import StringIO resultado=urllib.urlopen('trozo.html') html = resultado.read() parser= etree.HTMLParser() tree=etree.parse(StringIO.Str

我有一个网页解析程序,现在我想浏览标签,或者显示一个图表。 我怎样才能得到一张图表?或者在树中导航。展示第一步,然后是其他步骤,等等,并了解树是如何建造的

import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)

我只想检查节点!图表很酷,但我只想检查一下

您完成了解析,如果执行以下操作,您可以看到:

>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>
>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
        print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
        print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']