Javascript PythonScrape网站加载JS_Javascript_Python

Javascript PythonScrape网站加载JS

javascript python

Javascript PythonScrape网站加载JS,javascript,python,Javascript,Python,一般来说，我对python和编程非常陌生，但为了提高我的知识，我参加了一些课程。在学习时，心中有一个“目标”似乎非常重要，而我的目标之一就是成功地获取和处理体育数据我想从中获取结果，但它看起来像是通过JS动态加载数据：这里似乎有很多数据，结果可以追溯到20年前，加上当天每个赛马场的多场比赛。据我所知，selenium和beautifulsoup可能会在这里提供一些解决方案，但在我开始试验之前，我想和你们一起检查一下这个目标有多现实/网站如何构建数据以及如何开始的一些指针是否可以实现任何帮助

一般来说，我对python和编程非常陌生，但为了提高我的知识，我参加了一些课程。在学习时，心中有一个“目标”似乎非常重要，而我的目标之一就是成功地获取和处理体育数据

我想从中获取结果，但它看起来像是通过JS动态加载数据：

这里似乎有很多数据，结果可以追溯到20年前，加上当天每个赛马场的多场比赛。据我所知，selenium和beautifulsoup可能会在这里提供一些解决方案，但在我开始试验之前，我想和你们一起检查一下这个目标有多现实/网站如何构建数据以及如何开始的一些指针是否可以实现

任何帮助都将不胜感激

谢谢

我对Selenium或BeautifulSoup不太熟悉，但是还有其他与JavaScript相关的web scraper。我知道的一些是噩梦、幻影和僵尸（都是与恐怖有关的哈哈）。噩梦EJS运行于electron Chromium实例，PhantomJS是selenium的javascript包装，zombiejs是原始节点解决方案。我个人建议使用梦魇

然而，如果你需要在一个完全不同的球场的服务器上运行噩梦。噩梦EJS需要有图形界面。不过，有些模块允许在终端实例上运行噩梦EJB。如果您希望避免这种情况，那么您可以在服务器上安装PhantomJS并使用它

对于梦魇JS，有一个滚动选项，可能会触发加载其余数据

如果您希望仍然使用selenium或python之类的工具

我本来想说，通过查看开发者网络工具，您可以使用BHA所做的API网络调用，但是查看API quick，您需要使用API进行一些身份验证。

是的，selenium和beautifulsoup将使此数据相当容易提取。浏览一些教程并试一试。我建议从更小/更简单的项目开始，然后扩展，也许自己创建一个小的html站点，并尝试先将其删除