Python lxml CSS选择-特定零件

Python lxml CSS选择-特定零件,python,parsing,css-selectors,lxml,Python,Parsing,Css Selectors,Lxml,我需要一个网页的翻译部分 这是我的python代码: import urllib.request u = urllib.request.urlopen("https://docs.python-guide.org/writing/structure/#structure-of-the-repository") data = u.read() from lxml import html information = html.document_fromstring(data) for con

我需要一个网页的翻译部分

这是我的python代码:

import urllib.request

u = urllib.request.urlopen("https://docs.python-guide.org/writing/structure/#structure-of-the-repository")
data = u.read()

from lxml import html
information = html.document_fromstring(data)

for content in information.cssselect('ul li a'):
    print(content.text_content())
最后,我还得到了目录部分,我不知道如何过滤信息

什么是达到这一目标的正确途径


我不得不说,我从未使用过python,我对这方面的知识有限。

您可以获取所有
ul
,然后使用正确的一个来获取
li a

我发现6th
ul
有你的数据

for content in information.cssselect('ul')[6].cssselect('li a'):
    print(content.text_content())
结果

English
French
Chinese
Japanese
Korean
Filipino
Brazilian Portuguese

编辑:使用
xpath
同样需要
7而不是
6
,因为它从
1开始计数,而不是
0

for content in information.xpath('(//ul)[7]/li/a'):
    print(content.text_content())

首先找到所有的
ul
,然后用第二个找到
li a
我从你那里学到了一些新东西。你的回答清楚而准确。谢谢!!