Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/91.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用xpath从多个源中提取文本_Python_Html_Xpath_Web Scraping_Scrapy - Fatal编程技术网

Python 使用xpath从多个源中提取文本

Python 使用xpath从多个源中提取文本,python,html,xpath,web-scraping,scrapy,Python,Html,Xpath,Web Scraping,Scrapy,我为我的项目构建了一个scraper来提取3个站点的文本。我想使用一个蜘蛛的3个网站。 其中2个站点的it内容在此结构中: <div id="site1"> <p> this is a test </p> </div> <div id="site2"> <p> this is a test </p> </div> 如何修改此代码以从site3中提取文本?这可能有帮助: response

我为我的项目构建了一个scraper来提取3个站点的文本。我想使用一个蜘蛛的3个网站。 其中2个站点的it内容在此结构中:

<div id="site1">
   <p> this is a test </p>
</div>

<div id="site2">
   <p> this is a test </p>
</div>
如何修改此代码以从site3中提取文本?

这可能有帮助:
response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract() 
response.xpath('//div[@id="site1" or @id="site2" or @class="site3"]//p/text()').extract()
response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract()