Python 如何从(javascript?)网站上抓取网页?

Python 如何从(javascript?)网站上抓取网页?,python,html,web-scraping,beautifulsoup,urllib2,Python,Html,Web Scraping,Beautifulsoup,Urllib2,我试图从一个名为: 用我的代码,我正在寻找机场的名称,我想通过网页抓取“抵达”表。 网页抓取名称是有效的,因为这只是一个h1 HTML格式,但是如果我尝试用我的代码在网页上抓取这个表,我不会得到任何值,我只会得到对象名称(可能是因为有javascript?) 有没有什么解决方案,哪一个我可以在网页上抓取这部分的网页?(Python 2.7) 我试过这个: import urllib2, sys from BeautifulSoup import BeautifulSoup site= "htt

我试图从一个名为:

用我的代码,我正在寻找机场的名称,我想通过网页抓取“抵达”表。 网页抓取名称是有效的,因为这只是一个h1 HTML格式,但是如果我尝试用我的代码在网页上抓取这个表,我不会得到任何值,我只会得到对象名称(可能是因为有javascript?)

有没有什么解决方案,哪一个我可以在网页上抓取这部分的网页?(Python 2.7)

我试过这个:

import urllib2, sys
from BeautifulSoup import BeautifulSoup

site= "https://www.flightradar24.com/data/airports/bud/arrivals"
hdr = {'User-Agent': 'Mozilla/5.0'}
req = urllib2.Request(site,headers=hdr)
page = urllib2.urlopen(req)
soup = BeautifulSoup(page)
name = soup.find('h1' , attrs={'class' : 'airport-name'})
print name

table = soup.find('div', { "class" : "row cnt-schedule-table" })
print table
当我想要打印表格时,我得到了以下信息:


ArrivalTimeFlightFromAirlineAircraftStatus 0)“加载早期航班加载…抱歉,我们没有关于此机场航班的任何信息{{{objFlight.flight.status.generic.eventTime.utc*1000 |'''''date:timeFormat:timeZone}{{objFlight.flight.time.scheduled.arrival*1000 |'-'date:timeFormat:timeZone}{{objFlight.flight.airport.origin.position.region.city}{{{objFlight.flight.airport.name}{objFlight.time.scheduled.arrival*1000 | | | | | | | | | | | |日期:时区}{{objFlight.flight.flight.airport.ority.position region.city.city}{{{objFlight.flight.status.generic.eventTime.utc*1000 | |''''date:timeFormat:timeZone}0&;airportView.schedule.arrivals.page.current airportView.schedule.arrivals.page.total)“加载以后的航班*所有时间都在{(airportView.schedule.arrivals.data&;timeZone.toUpperCase()='utc':'local')}timezone是另一篇堆栈溢出文章,它有一个非常类似的问题解决方案。似乎您需要更改URL以匹配呈现的URL,而不是您通常在浏览器中使用的URL。

“我只获取对象名称”
-你这是什么意思?你得到的确切输出是什么?你用它检查的HTML是什么?(页面
的值,或其子集。)你认为为什么会涉及JavaScript?我是编程界的新手,我只是这么想。我编辑我的问题,如果我打印结果,你可以看到我得到了什么。我也尝试了这篇文章的代码(我将其更新为我的问题),但仍然不起作用。