Python 与BeautifulSoup不一致的刮削
我已经使用request.get下载了一些facebook页面的“关于部分”,并使用以下代码从页面上的迷你地图中删除坐标:Python 与BeautifulSoup不一致的刮削,python,html,web-scraping,Python,Html,Web Scraping,我已经使用request.get下载了一些facebook页面的“关于部分”,并使用以下代码从页面上的迷你地图中删除坐标: html = open(file, "r",encoding='utf-8').read() # Opening saved html soup = BeautifulSoup(html,'html.parser') # Parsing html map_url = soup.find_all(class_='_
html = open(file, "r",encoding='utf-8').read() # Opening saved html
soup = BeautifulSoup(html,'html.parser') # Parsing html
map_url = soup.find_all(class_='_a3f img') # Extracting url of map
parsed =urlparse.urlparse(map_url['src']) # Extracting url parameters
coordinate_marker = parse_qs(parsed.query)['markers'] # Return coordinates
除少数情况外,这一做法效果良好。在这些情况下,保存的html仍然有一个映射,str(soup)中的“a3f img”返回True,只是没有返回任何带有“find\u all”的内容
奇怪的是,当我在Chrome中打开保存的HTML时,将整个HTML复制并粘贴到一个新文件中,然后该文件运行良好并返回坐标(两个文件大小相同)
我尝试过更改解析器(运气不好)。对此的任何解释都将不胜感激