Python 当提供的数据是XML时，如何从inspect菜单检索相同的HTML？_Python_Web Scraping_Python Requests

Python 当提供的数据是XML时，如何从inspect菜单检索相同的HTML？

python web-scraping

Python 当提供的数据是XML时，如何从inspect菜单检索相同的HTML？,python,web-scraping,python-requests,Python,Web Scraping,Python Requests,我正在使用Python的请求模块来抓取此网站：现在它返回XML，我明白了。但是当我检查那个网站时，我看到的HTML结构是不同的，而且它的结构要好得多有没有一种方法可以通过请求而不是XML数据获取该数据？还是其他的选择？我想漂亮的汤可能会满足你的要求装靓汤 pip3 install beautifulsoup4 soup对象有望解析为您所期望的内容 import requests from bs4 import BeautifulSoup URL = 'https://www.monst

我正在使用Python的请求模块来抓取此网站：

现在它返回XML，我明白了。但是当我检查那个网站时，我看到的HTML结构是不同的，而且它的结构要好得多

有没有一种方法可以通过请求而不是XML数据获取该数据？还是其他的选择？

我想漂亮的汤可能会满足你的要求

装靓汤

pip3 install beautifulsoup4

soup对象有望解析为您所期望的内容

import requests
from bs4 import BeautifulSoup

URL = 'https://www.monster.com/jobs/search/?q=Software-Developer&where=Australia'
page = requests.get(URL)

soup = BeautifulSoup(page.content, 'html.parser')

是的，我想到了这一点，我不确定，因为源代码似乎只有XML。这是一个很好的选择，或者硒，但是如果可能的话，为什么不在请求中呢？他们有什么不同？啊，对不起，我不确定这是否有效。就像你说的，这是我想到的第一件事。实际上我通过检查找到了另一个URL：但它给了我一些xsl标记？我不知道浏览器从哪里得到HTMLBeautifulsou只是一个HTML解析器，为什么它会有区别？@AMC因为HTML和xml不一样我想网站上有一些JS代码将API响应xml转换成浏览器中看到的HTML。是的，我在代码中看到了一些xsl标记，是吗？是否无法检索我在浏览器中看到的最终结果？这是否回答了您的问题？但是当我检查那个网站时，我看到的HTML结构是不同的，而且它的结构要好得多。在哪方面更好？通常，直接访问数据比解析一堆HTML更可取。XML在我看来很好，真的吗？它被安排在HTML中有行的表格中。看起来更直观

import requests
from bs4 import BeautifulSoup

URL = 'https://www.monster.com/jobs/search/?q=Software-Developer&where=Australia'
page = requests.get(URL)

soup = BeautifulSoup(page.content, 'html.parser')