Python 3.x 我想刮这部分

Python 3.x 我想刮这部分,python-3.x,web-scraping,scrapy,Python 3.x,Web Scraping,Scrapy,我试图在屏幕截图中刮取每个面板,但是我没有得到正确的xpath来刮取这些部分。任何人都可以帮助我 此数据从附加请求中获取到https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059。在那里,您将获得包含全部信息的json UPD: 我如何获取它我在哪里可以找到这个json并获取里面的信息?通过这个url。你向它提出请求了吗?是的,但我不知道如何才能获得每个广告的url,因为我要刮去很多广告,所

我试图在屏幕截图中刮取每个面板,但是我没有得到正确的xpath来刮取这些部分。任何人都可以帮助我


此数据从附加请求中获取到https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059。在那里,您将获得包含全部信息的json

UPD:


我如何获取它我在哪里可以找到这个json并获取里面的信息?通过这个url。你向它提出请求了吗?是的,但我不知道如何才能获得每个广告的url,因为我要刮去很多广告,所以我需要一个xpath,可以引导我找到这个url。你只需要从主url获得id。将其应用于详细信息链接并解析结果。就这样。我已经用代码更新了答案。
url_id = re.search(r'/(\d+)\.htm', response.url).group(1)
details_url = 'https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce={}'
# make request to url
yield Request(details_url.format(url_id))