Python 当提供的数据是XML时,如何从inspect菜单检索相同的HTML?

Python 当提供的数据是XML时,如何从inspect菜单检索相同的HTML?,python,web-scraping,python-requests,Python,Web Scraping,Python Requests,我正在使用Python的请求模块来抓取此网站: 现在它返回XML,我明白了。但是当我检查那个网站时,我看到的HTML结构是不同的,而且它的结构要好得多 有没有一种方法可以通过请求而不是XML数据获取该数据?还是其他的选择?我想漂亮的汤可能会满足你的要求 装靓汤 pip3 install beautifulsoup4 soup对象有望解析为您所期望的内容 import requests from bs4 import BeautifulSoup URL = 'https://www.monst

我正在使用Python的请求模块来抓取此网站:

现在它返回XML,我明白了。但是当我检查那个网站时,我看到的HTML结构是不同的,而且它的结构要好得多


有没有一种方法可以通过请求而不是XML数据获取该数据?还是其他的选择?

我想漂亮的汤可能会满足你的要求

装靓汤

pip3 install beautifulsoup4
soup对象有望解析为您所期望的内容

import requests
from bs4 import BeautifulSoup

URL = 'https://www.monster.com/jobs/search/?q=Software-Developer&where=Australia'
page = requests.get(URL)

soup = BeautifulSoup(page.content, 'html.parser')

是的,我想到了这一点,我不确定,因为源代码似乎只有XML。这是一个很好的选择,或者硒,但是如果可能的话,为什么不在请求中呢?他们有什么不同?啊,对不起,我不确定这是否有效。就像你说的,这是我想到的第一件事。实际上我通过检查找到了另一个URL:但它给了我一些xsl标记?我不知道浏览器从哪里得到HTMLBeautifulsou只是一个HTML解析器,为什么它会有区别?@AMC因为HTML和xml不一样我想网站上有一些JS代码将API响应xml转换成浏览器中看到的HTML。是的,我在代码中看到了一些xsl标记,是吗?是否无法检索我在浏览器中看到的最终结果?这是否回答了您的问题?但是当我检查那个网站时,我看到的HTML结构是不同的,而且它的结构要好得多。在哪方面更好?通常,直接访问数据比解析一堆HTML更可取。XML在我看来很好,真的吗?它被安排在HTML中有行的表格中。看起来更直观
import requests
from bs4 import BeautifulSoup

URL = 'https://www.monster.com/jobs/search/?q=Software-Developer&where=Australia'
page = requests.get(URL)

soup = BeautifulSoup(page.content, 'html.parser')