Web scraping “美丽集团回归”；无”；即使元素存在_Web Scraping_Beautifulsoup

Web scraping “美丽集团回归”；无”；即使元素存在

web-scraping

Web scraping “美丽集团回归”；无”；即使元素存在,web-scraping,beautifulsoup,Web Scraping,Beautifulsoup,我想在亚马逊上削价出售一种产品。但美联却返回“无”。假设这会解决html.parser的问题，我改为lxml。但它不起作用。有人能帮我吗谢谢 import requests from bs4 import BeautifulSoup url = "https://www.amazon.com/Samsung-Inch-Internal-MZ-76E1T0B-AM/dp/B078DPCY3T" headers = {"UserAgent" : &q

我想在亚马逊上削价出售一种产品。但美联却返回“无”。假设这会解决html.parser的问题，我改为lxml。但它不起作用。有人能帮我吗

谢谢

import requests 
from  bs4 import BeautifulSoup

url = "https://www.amazon.com/Samsung-Inch-Internal-MZ-76E1T0B-AM/dp/B078DPCY3T"

headers = {"UserAgent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like 
Gecko) Chrome/87.0.4280.88 Safari/537.36"}

page = requests.get(url,headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
product_name = soup.find(id="productTitle").get_text()
product_price = soup.find(id="priceblock_ourprice").get_text()

print(product_name,"\n",product_price)

问题出在你写的标题中

headers={“UserAgent”…}

这是写的

headers={“用户代理”“…}

我想这就是问题所在

所以代码是这样的：

import requests 
from  bs4 import BeautifulSoup

url = "https://www.amazon.com/Samsung-Inch-Internal-MZ-76E1T0B-AM/dp/B078DPCY3T"

headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"}

page = requests.get(url,headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
product_name = soup.find(id="productTitle").get_text().strip()
product_price = soup.find(id="priceblock_ourprice").get_text().strip()

print(product_name)
print(product_price)

它对我有用。有时亚马逊会阻止你。可能尝试使用

试试

，除了

好。让我试试看不。仍然不起作用。整页都是疤痕。但是，单个元素是否有问题？例如：如果打印变量soupamazon阻止某个服务器IP，则会出现问题，请尝试

print（page.text）