Python 抓取MLB游戏日数据

Python 抓取MLB游戏日数据,python,xml,beautifulsoup,Python,Xml,Beautifulsoup,我正在使用BeautifulSoup尝试从MLB gameday页面中获取数据 现在,我只是想提取游戏日ID 下面是一个页面示例: url = "http://gd2.mlb.com/components/game/mlb/year_2017/month_04/day_20/epg.xml" soup = BeautifulSoup(urlopen(d_url), "lxml") 在这之后,我不知道如何导航和找到ID 每种游戏都将其存储在两个不同的位置: game_data_direct

我正在使用BeautifulSoup尝试从MLB gameday页面中获取数据

现在,我只是想提取游戏日ID

下面是一个页面示例:

url = "http://gd2.mlb.com/components/game/mlb/year_2017/month_04/day_20/epg.xml"

soup = BeautifulSoup(urlopen(d_url), "lxml")
在这之后,我不知道如何导航和找到ID

每种游戏都将其存储在两个不同的位置:

  game_data_directory="/components/game/mlb/year_2017/month_04/day_20/
                       gid_2017_04_20_bosmlb_tormlb_1"

gameday="2017_04_20_bosmlb_tormlb_1"
找到并存储ID的最佳方法是什么

谢谢。

'.joingame'.data'.split'/'[-1]。split'.[1:]
data = requests.get('http://gd2.mlb.com/components/game/mlb/year_2017/month_04/day_20/epg.xml')
data = BeautifulSoup(data.content, "lxml")

for game in data.find_all('game'):
    print(game['game_data_directory'])
    pos = game['game_data_directory'].rfind('/')
    print(game['game_data_directory'][46:])