Javascript PythonScrape网站加载JS

Javascript PythonScrape网站加载JS,javascript,python,Javascript,Python,一般来说,我对python和编程非常陌生,但为了提高我的知识,我参加了一些课程。在学习时,心中有一个“目标”似乎非常重要,而我的目标之一就是成功地获取和处理体育数据 我想从中获取结果,但它看起来像是通过JS动态加载数据: 这里似乎有很多数据,结果可以追溯到20年前,加上当天每个赛马场的多场比赛。据我所知,selenium和beautifulsoup可能会在这里提供一些解决方案,但在我开始试验之前,我想和你们一起检查一下这个目标有多现实/网站如何构建数据以及如何开始的一些指针是否可以实现 任何帮助

一般来说,我对python和编程非常陌生,但为了提高我的知识,我参加了一些课程。在学习时,心中有一个“目标”似乎非常重要,而我的目标之一就是成功地获取和处理体育数据

我想从中获取结果,但它看起来像是通过JS动态加载数据:

这里似乎有很多数据,结果可以追溯到20年前,加上当天每个赛马场的多场比赛。据我所知,selenium和beautifulsoup可能会在这里提供一些解决方案,但在我开始试验之前,我想和你们一起检查一下这个目标有多现实/网站如何构建数据以及如何开始的一些指针是否可以实现

任何帮助都将不胜感激


谢谢

我对Selenium或BeautifulSoup不太熟悉,但是还有其他与JavaScript相关的web scraper。我知道的一些是噩梦、幻影和僵尸(都是与恐怖有关的哈哈)。噩梦EJS运行于electron Chromium实例,PhantomJS是selenium的javascript包装,zombiejs是原始节点解决方案。我个人建议使用梦魇

然而,如果你需要在一个完全不同的球场的服务器上运行噩梦。噩梦EJS需要有图形界面。不过,有些模块允许在终端实例上运行噩梦EJB。如果您希望避免这种情况,那么您可以在服务器上安装PhantomJS并使用它

对于梦魇JS,有一个滚动选项,可能会触发加载其余数据

如果您希望仍然使用selenium或python之类的工具


我本来想说,通过查看开发者网络工具,您可以使用BHA所做的API网络调用,但是查看API quick,您需要使用API进行一些身份验证。

是的,selenium和beautifulsoup将使此数据相当容易提取。浏览一些教程并试一试。我建议从更小/更简单的项目开始,然后扩展,也许自己创建一个小的html站点,并尝试先将其删除