Python 使用xpath从多个源中提取文本
我为我的项目构建了一个scraper来提取3个站点的文本。我想使用一个蜘蛛的3个网站。 其中2个站点的it内容在此结构中:Python 使用xpath从多个源中提取文本,python,html,xpath,web-scraping,scrapy,Python,Html,Xpath,Web Scraping,Scrapy,我为我的项目构建了一个scraper来提取3个站点的文本。我想使用一个蜘蛛的3个网站。 其中2个站点的it内容在此结构中: <div id="site1"> <p> this is a test </p> </div> <div id="site2"> <p> this is a test </p> </div> 如何修改此代码以从site3中提取文本?这可能有帮助: response
<div id="site1">
<p> this is a test </p>
</div>
<div id="site2">
<p> this is a test </p>
</div>
如何修改此代码以从site3中提取文本?这可能有帮助:
response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract()
response.xpath('//div[@id="site1" or @id="site2" or @class="site3"]//p/text()').extract()
response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract()