Python 我怎样才能从美国银行那里挤出营业时间?

Python 我怎样才能从美国银行那里挤出营业时间?,python,web-scraping,screen-scraping,beautifulsoup,Python,Web Scraping,Screen Scraping,Beautifulsoup,嗨,我想知道我怎么能用beautifulsoup来刮美国银行的钱。 例如,如果url是 Shattuck_Ave_94704_BERKELEY_CA/银行分行地点/>http://locators.bankofamerica.com/locator/locator/2129_Shattuck_Ave_94704_BERKELEY_CA/bank_branch_locations/ 我如何只提取小时数? 下面是我最初的尝试,但似乎什么也没有回报 page = urllib2.urlopen(url

嗨,我想知道我怎么能用beautifulsoup来刮美国银行的钱。 例如,如果url是 Shattuck_Ave_94704_BERKELEY_CA/银行分行地点/>http://locators.bankofamerica.com/locator/locator/2129_Shattuck_Ave_94704_BERKELEY_CA/bank_branch_locations/ 我如何只提取小时数? 下面是我最初的尝试,但似乎什么也没有回报

page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
hours = soup.find_all("div", class_="lobbyHours")
print hours

这个url会重定向,这就是为什么soup.find_alldiv,class_u=lobbyHours不会返回任何内容。您重定向到的页面上没有该类的div

通过使用Firefox监控网络流量,我发现您请求的url实际上返回了301状态码。幸运的是,即使是响应头中的301状态代码也提供了位置头。在这种情况下:

'http://locators.bankofamerica.com/locator/locator/LocatorAction.do?shouldTest=true'
这是分支定位器页面。您必须从这个页面开始,以编程方式“搜索”您想要的位置,找到合适的链接,然后执行第三个请求


该网站还使用cookies,所以请查看。

该url重定向,这就是为什么soup.find\u alldiv,class=lobbyHours不返回任何内容。您重定向到的页面上没有该类的div

通过使用Firefox监控网络流量,我发现您请求的url实际上返回了301状态码。幸运的是,即使是响应头中的301状态代码也提供了位置头。在这种情况下:

'http://locators.bankofamerica.com/locator/locator/LocatorAction.do?shouldTest=true'
这是分支定位器页面。您必须从这个页面开始,以编程方式“搜索”您想要的位置,找到合适的链接,然后执行第三个请求


该网站也使用cookies,所以请查看。

否。但我可以想象,所有分支机构无论在哪里都有相同的开放时间。在英国,这是真实的,除了一些分行在周六关闭。这是相当静态的。但我可以想象,无论在哪里,所有分行的营业时间都是一样的。在英国,这是真实的,除了一些分行在周六关闭。这是相当静态的。或者使用mechanize来管理cookies和处理重定向。或者使用mechanize来管理cookies和处理重定向。