Python 如何将CSS选择器的输出传递给Beauty soup?

Python 如何将CSS选择器的输出传递给Beauty soup?,python,css,web-scraping,css-selectors,beautifulsoup,Python,Css,Web Scraping,Css Selectors,Beautifulsoup,我想刮一些网页,我正在使用一个名为“SelectorGadget”的Chrome扩展。它是一个CSS选择器。现在,以该URL为例: CSS选择器为文件列表提供以下输出:tr~tr+tr td+td a现在,问题是我不知道如何将此输出传递给beautiful soup。在以下行中,.select()无法识别这些选择器 import requests page = requests.get("http://www.www2015.it/documents/proceedings/forms/proc

我想刮一些网页,我正在使用一个名为“SelectorGadget”的Chrome扩展。它是一个CSS选择器。现在,以该URL为例: CSS选择器为文件列表提供以下输出:tr~tr+tr td+td a现在,问题是我不知道如何将此输出传递给beautiful soup。在以下行中,.select()无法识别这些选择器

import requests
page = requests.get("http://www.www2015.it/documents/proceedings/forms/proceedings.htm")
import bs4
soup = bs4.BeautifulSoup(page.content)
soup.select("tr~ tr+ tr td+ td a")

问题是-
BeautifulSoup
有一个。在您的情况下,使用
~
+
进行横向操作将无法正常工作

如果您希望匹配此页面上的
pdf
链接,我将使用以下选择器:

soup.select("a[href$=pdf]")  # get the links where href ends with "pdf"

你可以发布你的代码吗?你现在拥有的是什么?当我使用.select()时,你是指
.select(…)
?@jornsharpe它说:不支持或无效的CSS选择器:“tr~”,然后使用支持的和有效的选择器,但这就是你在BS中使用选择器的方式。@jornsharpe你的意思是选择器小工具返回无效的选择器吗?你知道任何可以处理这些选择器的scarper吗?@RaminZahedi是的,查看lxml.cssselect。