Python lxml CSS选择-特定零件
我需要一个网页的翻译部分 这是我的python代码:Python lxml CSS选择-特定零件,python,parsing,css-selectors,lxml,Python,Parsing,Css Selectors,Lxml,我需要一个网页的翻译部分 这是我的python代码: import urllib.request u = urllib.request.urlopen("https://docs.python-guide.org/writing/structure/#structure-of-the-repository") data = u.read() from lxml import html information = html.document_fromstring(data) for con
import urllib.request
u = urllib.request.urlopen("https://docs.python-guide.org/writing/structure/#structure-of-the-repository")
data = u.read()
from lxml import html
information = html.document_fromstring(data)
for content in information.cssselect('ul li a'):
print(content.text_content())
最后,我还得到了目录部分,我不知道如何过滤信息
什么是达到这一目标的正确途径
我不得不说,我从未使用过python,我对这方面的知识有限。您可以获取所有
ul
,然后使用正确的一个来获取li a
我发现6thul
有你的数据
for content in information.cssselect('ul')[6].cssselect('li a'):
print(content.text_content())
结果
English
French
Chinese
Japanese
Korean
Filipino
Brazilian Portuguese
编辑:使用
xpath
同样需要7而不是6
,因为它从1开始计数,而不是0
for content in information.xpath('(//ul)[7]/li/a'):
print(content.text_content())
首先找到所有的ul
,然后用第二个找到li a
我从你那里学到了一些新东西。你的回答清楚而准确。谢谢!!