Web scraping 带和服的嵌套API结构
我想将一个站点转换为一个带有和服的API,它具有以下结构(我指的是视觉上的,而不是标记vise): 等等。。。 我希望API能够反映这种层次结构,所以它应该是这样的:Web scraping 带和服的嵌套API结构,web-scraping,kimono,Web Scraping,Kimono,我想将一个站点转换为一个带有和服的API,它具有以下结构(我指的是视觉上的,而不是标记vise): 等等。。。 我希望API能够反映这种层次结构,所以它应该是这样的: { "CATEGORY 1": { "Product 1": { "price": "$" }, "Product 2": { "price": "$" }, "Product 3": { "price": "$" } }, "CATE
{
"CATEGORY 1": {
"Product 1": {
"price": "$"
},
"Product 2": {
"price": "$"
},
"Product 3": {
"price": "$"
}
},
"CATEGORY 2": {
"Product 1": {
"price": "$"
},
"Product 2": {
"price": "$"
},
"Product 3": {
"price": "$"
}
}
}
{
"collection1": [
{
"property1": "Category 1",
"property4": "Product 1",
"property5": "price"
},
{
"property1": "Category 2",
"property4": "Product 1",
"property5": "price"
}
]
}
问题是站点的标记没有显示此层次结构(产品没有嵌套在类别中):
有可能做到这一点吗?如果CSS选择器不起作用,那么很可能是这样,如果您不知道测试的页面url,那么就无法提供更多帮助 您还可以尝试将Cat1、Cat2数据放在不同的集合中,用 CSS: 和中间部分的regexp:
CATEGORY 1
{
"collection1": [
{
"property1": "Category 1",
"property4": "Product 1",
"property5": "price"
},
{
"property1": "Category 2",
"property4": "Product 1",
"property5": "price"
}
]
}
...> h3
CATEGORY 1