Python 使用scrapyd爬虫提取json_Python_Json_Scrapyd

Python 使用scrapyd爬虫提取json

python json

Python 使用scrapyd爬虫提取json,python,json,scrapyd,Python,Json,Scrapyd,如何仅从此网页代码中提取schema.org？它是json格式的，这给了我很多时间。我只需要提供schema.org链接的信息。当我爬网时，我想从每个网站提取schema.org并将其放入一个文件中 <script type="application/ld+json"> { "@context": "http://schema.org", "@type": "Product", "name": "Scutece Huggies Ultra Confort BO

如何仅从此网页代码中提取schema.org？它是json格式的，这给了我很多时间。我只需要提供schema.org链接的信息。当我爬网时，我想从每个网站提取schema.org并将其放入一个文件中

<script type="application/ld+json">
{
    "@context": "http://schema.org",
    "@type": "Product",
    "name": "Scutece Huggies Ultra Confort BOX 5, Girl, 12-22 kg, 105 buc",
        "url":"http://www.emag.ro/scutece-huggies-ultra-confort-box-5-girl-12-22-kg-105-buc-5029053546919/pd/DPS0Q7BBM/",
    "sku":"DPS0Q7BBM",
    "brand": {
        "@type": "Brand",
        "name": "Huggies"
    },
    "offers": {
        "@type": "Offer",
        "seller": "eMAG",
        "availability": "http://schema.org/InStock",
    },
    }
</script>


{
“@context”：”http://schema.org",
“@type”：“产品”，
“名称”：“Scutece Huggies Ultra Confort 5号包厢，女孩，体重12-22公斤，体重105 buc”，
“url”：”http://www.emag.ro/scutece-huggies-ultra-confort-box-5-girl-12-22-kg-105-buc-5029053546919/pd/DPS0Q7BBM/",
“sku”：“DPS0Q7BBM”，
“品牌”：{
“@type”：“Brand”，
“姓名”：“哈吉斯”
},
“提议”：{
“@type”：“Offer”，
“卖方”：“eMAG”，
“可用性”：http://schema.org/InStock",
},
}

更新：

已经尝试过以下方法：

导入json

jsonresponse=json.loads（response.body_为_unicode（））

告诉我：无法解码任何JSON对象

您想提取“schema.org”是什么意思？例如，预期的输出是什么？你写了什么代码？每次我抓取一个页面时，我都想看到它有一个。基本上我只想提取这两个信息：“@context:”和“availability:”，