Python 网站刮取未正确格式化的网站_Python_Html_Web Scraping_Beautifulsoup_Format

Python 网站刮取未正确格式化的网站

python html web-scraping

Python 网站刮取未正确格式化的网站,python,html,web-scraping,beautifulsoup,format,Python,Html,Web Scraping,Beautifulsoup,Format,我正在抓取一个网站链接https://homeshopping.pk/search.php?q=samsung%20phones. 我发现很难进入一个div类。我认为它的格式不正确。问这个问题的原因是为了确认它的格式是否正确，或者我做错了什么截图为：这就是这个东西装载产品的地方- 现在，那些参数修好了吗？我一点儿也不知道。你能解析这个吗？当然，使用json.loads而不是bs进行解析 import requests, json source = requests.get('https:

我正在抓取一个网站链接https://homeshopping.pk/search.php?q=samsung%20phones. 我发现很难进入一个div类。我认为它的格式不正确。问这个问题的原因是为了确认它的格式是否正确，或者我做错了什么

截图为：

这就是这个东西装载产品的地方-

现在，那些参数修好了吗？我一点儿也不知道。你能解析这个吗？当然，使用json.loads而不是bs进行解析

import requests, json

source = requests.get('https://api-v3.findify.io/v3/search?user[uid]=TW1bcavcZKWeb32z&user[sid]=6kn0FcKb4QjgMz60&user&t_client=1584424566753&key=cae15cfe-508b-41d1-a019-161c02ffd97c&q=samsung%20phones')
j = json.loads(source.content.decode())

for item in j["items"]:
    print(item["title"])

这就是这个东西装载产品的地方-现在，这些参数是固定的吗？我一点儿也不知道。你能解析这个吗？当然，用json.loads解析，而不是bs。亲爱的Boris，请告诉我你从哪里得到这个url，我是网络垃圾处理的新手，需要知道这一点。我刚刚查看了Firefox网络调试选项卡，或者不管它的正确名称是什么，加载页面，，并在内容中搜索其中一个产品名称，以立即找到其来源。比一些人想象的要容易：

import requests, json

source = requests.get('https://api-v3.findify.io/v3/search?user[uid]=TW1bcavcZKWeb32z&user[sid]=6kn0FcKb4QjgMz60&user&t_client=1584424566753&key=cae15cfe-508b-41d1-a019-161c02ffd97c&q=samsung%20phones')
j = json.loads(source.content.decode())

for item in j["items"]:
    print(item["title"])