Python 使用scrapyd爬虫提取json

Python 使用scrapyd爬虫提取json,python,json,scrapyd,Python,Json,Scrapyd,如何仅从此网页代码中提取schema.org?它是json格式的,这给了我很多时间。我只需要提供schema.org链接的信息。当我爬网时,我想从每个网站提取schema.org并将其放入一个文件中 <script type="application/ld+json"> { "@context": "http://schema.org", "@type": "Product", "name": "Scutece Huggies Ultra Confort BO

如何仅从此网页代码中提取schema.org?它是json格式的,这给了我很多时间。我只需要提供schema.org链接的信息。当我爬网时,我想从每个网站提取schema.org并将其放入一个文件中

<script type="application/ld+json">
{
    "@context": "http://schema.org",
    "@type": "Product",
    "name": "Scutece Huggies Ultra Confort BOX 5, Girl, 12-22 kg, 105 buc",
        "url":"http://www.emag.ro/scutece-huggies-ultra-confort-box-5-girl-12-22-kg-105-buc-5029053546919/pd/DPS0Q7BBM/",
    "sku":"DPS0Q7BBM",
    "brand": {
        "@type": "Brand",
        "name": "Huggies"
    },
    "offers": {
        "@type": "Offer",
        "seller": "eMAG",
        "availability": "http://schema.org/InStock",
    },
    }
</script>

{
“@context”:”http://schema.org",
“@type”:“产品”,
“名称”:“Scutece Huggies Ultra Confort 5号包厢,女孩,体重12-22公斤,体重105 buc”,
“url”:”http://www.emag.ro/scutece-huggies-ultra-confort-box-5-girl-12-22-kg-105-buc-5029053546919/pd/DPS0Q7BBM/",
“sku”:“DPS0Q7BBM”,
“品牌”:{
“@type”:“Brand”,
“姓名”:“哈吉斯”
},
“提议”:{
“@type”:“Offer”,
“卖方”:“eMAG”,
“可用性”:http://schema.org/InStock",
},
}
更新:

已经尝试过以下方法:

导入json

jsonresponse=json.loads(response.body_为_unicode())


告诉我:无法解码任何JSON对象

您想提取“schema.org”是什么意思?例如,预期的输出是什么?你写了什么代码?每次我抓取一个页面时,我都想看到它有一个。基本上我只想提取这两个信息:“@context:”和“availability:”,