Python scrapy scrape html源代码_Python_Html_Python 2.7_Scrapy

Python scrapy scrape html源代码

python html python-2.7 scrapy

Python scrapy scrape html源代码,python,html,python-2.7,scrapy,Python,Html,Python 2.7,Scrapy,我正在使用scrapy来抓取和刮取一个网站。我需要整个html而不是组件。我们可以使用xpath选择器轻松地提取组件，但是否有任何方法可以提取给定类的整个html块。例如，在下面的html代码中，我需要整个div块prod basic info的确切html源代码。还有什么我可以做的吗 <div class="block prod-basic-info"> <h2>Product information</h2> <p class="product-

我正在使用scrapy来抓取和刮取一个网站。我需要整个html而不是组件。我们可以使用xpath选择器轻松地提取组件，但是否有任何方法可以提取给定类的整个html块。例如，在下面的html代码中，我需要整个div块prod basic info的确切html源代码。还有什么我可以做的吗

<div class="block prod-basic-info">
 <h2>Product information</h2>
 <p class="product-info-label">Category</p>
  <p>
   <a href="xyz.html"</a>
 </p>
</div>


产品信息
类别

只需将您的xpath
表达式或CSS
选择器指向元素即可：
response.xpath('//div[contains(@class, "prod-basic-info")]').extract()[0]
response.css('div.prod-basic-info').extract()[0]