Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/279.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 网站刮取未正确格式化的网站_Python_Html_Web Scraping_Beautifulsoup_Format - Fatal编程技术网

Python 网站刮取未正确格式化的网站

Python 网站刮取未正确格式化的网站,python,html,web-scraping,beautifulsoup,format,Python,Html,Web Scraping,Beautifulsoup,Format,我正在抓取一个网站链接https://homeshopping.pk/search.php?q=samsung%20phones. 我发现很难进入一个div类。我认为它的格式不正确。问这个问题的原因是为了确认它的格式是否正确,或者我做错了什么 截图为: 这就是这个东西装载产品的地方- 现在,那些参数修好了吗?我一点儿也不知道。你能解析这个吗?当然,使用json.loads而不是bs进行解析 import requests, json source = requests.get('https:

我正在抓取一个网站链接https://homeshopping.pk/search.php?q=samsung%20phones. 我发现很难进入一个div类。我认为它的格式不正确。问这个问题的原因是为了确认它的格式是否正确,或者我做错了什么

截图为:


这就是这个东西装载产品的地方-

现在,那些参数修好了吗?我一点儿也不知道。你能解析这个吗?当然,使用json.loads而不是bs进行解析

import requests, json

source = requests.get('https://api-v3.findify.io/v3/search?user[uid]=TW1bcavcZKWeb32z&user[sid]=6kn0FcKb4QjgMz60&user&t_client=1584424566753&key=cae15cfe-508b-41d1-a019-161c02ffd97c&q=samsung%20phones')
j = json.loads(source.content.decode())

for item in j["items"]:
    print(item["title"])

这就是这个东西装载产品的地方-现在,这些参数是固定的吗?我一点儿也不知道。你能解析这个吗?当然,用json.loads解析,而不是bs。亲爱的Boris,请告诉我你从哪里得到这个url,我是网络垃圾处理的新手,需要知道这一点。我刚刚查看了Firefox网络调试选项卡,或者不管它的正确名称是什么,加载页面,,并在内容中搜索其中一个产品名称,以立即找到其来源。比一些人想象的要容易:
import requests, json

source = requests.get('https://api-v3.findify.io/v3/search?user[uid]=TW1bcavcZKWeb32z&user[sid]=6kn0FcKb4QjgMz60&user&t_client=1584424566753&key=cae15cfe-508b-41d1-a019-161c02ffd97c&q=samsung%20phones')
j = json.loads(source.content.decode())

for item in j["items"]:
    print(item["title"])