Python BeautifulSoup返回错误的html代码

Python BeautifulSoup返回错误的html代码,python,html,python-3.x,beautifulsoup,Python,Html,Python 3.x,Beautifulsoup,我正在尝试从imdb列表中获取电影名称。我的问题是,它没有返回出现在google chrome inspect元素中的英文名称,而是返回日文名称 注意:我尝试了所有BeautifulSoup解析器 代码: 结果: <h3 class="lister-item-header"> <span class="lister-item-index unbold text-primary">1.</span> <a href="/title/tt0245429/?r

我正在尝试从imdb列表中获取电影名称。我的问题是,它没有返回出现在google chrome inspect元素中的英文名称,而是返回日文名称

注意:我尝试了所有BeautifulSoup解析器

代码:

结果:

<h3 class="lister-item-header">
<span class="lister-item-index unbold text-primary">1.</span>
<a href="/title/tt0245429/?ref_=ttls_li_tt">Sen to Chihiro no kamikakushi</a>
<span class="lister-item-year text-muted unbold">(2001)</span>
</h3>

1.
(2001)
页面源中显示的预期结果:


您可以看到英文名称,但我得到的是日文名称。任何帮助都将不胜感激。

如果您从非浏览器客户端访问imdb,imdb将把电影名称翻译成原始语言。您应该能够通过向请求添加标题来修复它

import requests
from bs4 import BeautifulSoup
headers = {"Accept-Language": "en-US, en;q=0.5"}
page=requests.get('https://www.imdb.com/list/ls040141830/', headers = headers)
soup = BeautifulSoup(page.text,'lxml')
name = soup.find('h3','lister-item-header')
print(name)

似乎如果您从非浏览器客户端访问imdb,imdb将把电影名称翻译成原始语言。您应该能够通过向请求添加标题来修复它

import requests
from bs4 import BeautifulSoup
headers = {"Accept-Language": "en-US, en;q=0.5"}
page=requests.get('https://www.imdb.com/list/ls040141830/', headers = headers)
soup = BeautifulSoup(page.text,'lxml')
name = soup.find('h3','lister-item-header')
print(name)

也许,在初始页面加载之后,一些java脚本执行并将本地名称翻译成英语,在浏览器中您已经看到了英语?您是否试图从日本获取ip地址为的imdb页面?@kosist是的,在broser中我看到了english@MrAlihoseiny没有我的正常ipMaybe,在初始页面加载之后,一些java脚本执行本地名称并将其翻译为英语,在浏览器中,您已经看到了它的英语版本?您是否正在尝试从日本获取具有ip地址的imdb页面?@kosist是的,在broser中我看到了它english@MrAlihoseiny没有我的正常ip