Python Scrapy不会打印成json、html或任何其他文件
我试图将我的刮取元素输出到json文件。当我选择打印quotestoscrape.com页面的整个正文时,它成功地做到了。但是,当我选择打印某些元素(如span标记或p标记)时,json文件中不会显示任何刮取的项目。 这是我的scrapy文件,它尝试从站点quotestoscrape.com中刮取span.text元素:Python Scrapy不会打印成json、html或任何其他文件,python,scrapy,screen-scraping,Python,Scrapy,Screen Scraping,我试图将我的刮取元素输出到json文件。当我选择打印quotestoscrape.com页面的整个正文时,它成功地做到了。但是,当我选择打印某些元素(如span标记或p标记)时,json文件中不会显示任何刮取的项目。 这是我的scrapy文件,它尝试从站点quotestoscrape.com中刮取span.text元素: import scrapy class heyhey(scrapy.Spider): name = "samuelbb" start_ur
import scrapy
class heyhey(scrapy.Spider):
name = "samuelbb"
start_urls = ["http://quotes.toscrape.com"]
def parse(self,response):
with open("new.json","wb") as f:
f.write(response.css("span::text").getall())
我做错了什么?你的css错了
span::text
使用此备忘单了解更多信息
如果您想以json格式输出
import scrapy
class heyhey(scrapy.Spider):
name = "samuelbb"
start_urls = ["http://quotes.toscrape.com"]
def parse(self,response):
name = response.css("span::text").getall()
yield{
'name':name
}
命令:
scrapy crawl samuelbb -o data.json
你的css是错误的
span::text
使用此备忘单了解更多信息
如果您想以json格式输出
import scrapy
class heyhey(scrapy.Spider):
name = "samuelbb"
start_urls = ["http://quotes.toscrape.com"]
def parse(self,response):
name = response.css("span::text").getall()
yield{
'name':name
}
命令:
scrapy crawl samuelbb -o data.json
我只是试着用::代替,没有任何区别。谢谢你抽出时间重写整个代码。我只是试着用::代替,没有任何区别。谢谢你抽出时间重写整个代码。