使用BeautifulSoup(Python)为列表抓取电影总量
我开始用Python(3)编写代码。我想提取一些与电影相关的数据,这里是 我已经搜集了与投票数有关的数据:使用BeautifulSoup(Python)为列表抓取电影总量,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我开始用Python(3)编写代码。我想提取一些与电影相关的数据,这里是 我已经搜集了与投票数有关的数据: first_votes = first_movie.find('span', attrs = {'name':'nv'}) first_votes first_votes['data-value'] 这给了我这部电影被用户评价的准确次数 但当我试图刮取总票数时,我真的不知道如何使代码集中于总票数,因为总票数和票数具有相同的结构: 你们有谁知道怎么解决这个问题吗?对不起,如果我没有提供
first_votes = first_movie.find('span', attrs = {'name':'nv'})
first_votes
first_votes['data-value']
这给了我这部电影被用户评价的准确次数
但当我试图刮取总票数时,我真的不知道如何使代码集中于总票数,因为总票数和票数具有相同的结构:
你们有谁知道怎么解决这个问题吗?对不起,如果我没有提供任何其他信息,但我是新的。如果您需要一些信息,我很乐意提供。您可以使用
findAll
方法获取符合您标准的所有元素的列表,然后您可以选择列表中的第二个元素,例如:
first_votes = first_movie.findAll('span', attrs = {'name':'nv'})[1]
您可以对
投票
和总投票
votes = first_movie.find_all('span', attrs = {'name':'nv'})[0]['data-value']
gross = first_movie.find_all('span', attrs = {'name':'nv'})[1]['data-value']
或者在一行中
votes, gross = [item['data-value'] for item in first_movie.find_all('span', attrs = {'name':'nv'})]