Python 自动化web任务？_Python_Selenium_Automation_Web Scraping_Capybara

Python 自动化web任务？

python selenium automation web-scraping

Python 自动化web任务？,python,selenium,automation,web-scraping,capybara,Python,Selenium,Automation,Web Scraping,Capybara,我在chess.com上玩，我想下载我的游戏历史。不幸的是，他们并没有让这变得容易：我一次可以访问50个游戏的100页，点击“全选”和“下载”，然后他们通过电子邮件发送给我有没有一种方法可以用python或其他语言编写脚本，帮助我自动化流程的任何部分？模拟点击链接的东西？水豚对单元测试之外的事情有用吗？硒我还没有太多的网络开发经验。谢谢你的帮助您可能想查看CasperJS。我使用Python启动CasperJS脚本来进行web抓取，并将数据返回到Python以进一步解析或存储到数据库等 P

我在chess.com上玩，我想下载我的游戏历史。不幸的是，他们并没有让这变得容易：我一次可以访问50个游戏的100页，点击“全选”和“下载”，然后他们通过电子邮件发送给我

有没有一种方法可以用python或其他语言编写脚本，帮助我自动化流程的任何部分？模拟点击链接的东西？水豚对单元测试之外的事情有用吗？硒

我还没有太多的网络开发经验。谢谢你的帮助

您可能想查看CasperJS。我使用Python启动CasperJS脚本来进行web抓取，并将数据返回到Python以进一步解析或存储到数据库等

Python本身有BeautifulSoup和Mechanize，但与基于Ajax的站点的结合并不好

Python和CasperJS非常完美

如果你想做这样的事情，硒可能是一个很好的选择

下面是一些伪代码：

foreach page_link in page_links:
  page_link.click()
  select_all.click()
  download_link.click()

看一看。使用此Python库可以相对容易地实现所需的操作：

start_chrome("chess.com")
...
click("Select All")
click("Download")
...

等等。

因此，如果我正在查看的网站不是基于AJAX的，那么BeautifulSoup可能是理想的解决方案？是的，如果您不尝试获取JavaScript操纵的动态数据，我会说BeautifulSoup会更快。