Web scraping 带和服的嵌套API结构

Web scraping 带和服的嵌套API结构,web-scraping,kimono,Web Scraping,Kimono,我想将一个站点转换为一个带有和服的API,它具有以下结构(我指的是视觉上的,而不是标记vise): 等等。。。 我希望API能够反映这种层次结构,所以它应该是这样的: { "CATEGORY 1": { "Product 1": { "price": "$" }, "Product 2": { "price": "$" }, "Product 3": { "price": "$" } }, "CATE

我想将一个站点转换为一个带有和服的API,它具有以下结构(我指的是视觉上的,而不是标记vise):

等等。。。 我希望API能够反映这种层次结构,所以它应该是这样的:

{
  "CATEGORY 1": {
    "Product 1": {
      "price": "$"
    },
    "Product 2": {
      "price": "$"
    },
    "Product 3": {
      "price": "$"
    }
  },
  "CATEGORY 2": {
    "Product 1": {
      "price": "$"
    },
    "Product 2": {
      "price": "$"
    },
    "Product 3": {
      "price": "$"
    }
  }
}
{
  "collection1": [
    {
      "property1": "Category 1",
      "property4": "Product 1",
      "property5": "price"
    },
    {
      "property1": "Category 2",
      "property4": "Product 1",
      "property5": "price"
    }
  ]
}
问题是站点的标记没有显示此层次结构(产品没有嵌套在类别中):


有可能做到这一点吗?

如果CSS选择器不起作用,那么很可能是这样,如果您不知道测试的页面url,那么就无法提供更多帮助

您还可以尝试将Cat1、Cat2数据放在不同的集合中,用 CSS:

和中间部分的regexp:

CATEGORY 1
{
  "collection1": [
    {
      "property1": "Category 1",
      "property4": "Product 1",
      "property5": "price"
    },
    {
      "property1": "Category 2",
      "property4": "Product 1",
      "property5": "price"
    }
  ]
}
...> h3
CATEGORY 1