Ruby获取带有动态内容的HTML源代码_Ruby

Ruby获取带有动态内容的HTML源代码

ruby

Ruby获取带有动态内容的HTML源代码,ruby,Ruby,我试图加载页面的动态内容以及静态HTML。例如，如果我只是加载HTML，它将丢失页面底部的大推荐框。我知道我可以使用 html = open(url).read 但同样，这将丢失页面加载时显示的动态内容。我怎样才能得到与浏览网站时得到的内容相匹配的完整HTML？谢谢我通过使用ruby gem和设置用户代理解决了我的问题。虽然不一定是对我的问题的回答，但我将user_agent设置为搜索机器人，带有javascript的页面会以一种不太动态的形式显示出来。watir也可能对您有所帮助。您还需要

我试图加载页面的动态内容以及静态HTML。例如，如果我只是加载HTML，它将丢失页面底部的大推荐框。我知道我可以使用

html = open(url).read

但同样，这将丢失页面加载时显示的动态内容。我怎样才能得到与浏览网站时得到的内容相匹配的完整HTML？谢谢

我通过使用ruby gem和设置用户代理解决了我的问题。虽然不一定是对我的问题的回答，但我将user_agent设置为搜索机器人，带有javascript的页面会以一种不太动态的形式显示出来。

watir也可能对您有所帮助。

您还需要运行javascript。我听说Selenium可以在这里提供帮助。如果我错了，请纠正我，但似乎Selenium更适合执行自动化任务和测试。我只需要执行页面加载。我正在寻找网页上的信息，这些信息通常是动态加载的，而不是在html源代码中。当你在浏览器上查看源代码时，你仍然没有得到我想要的信息。我用过capybara来做这样的事情：如果我不需要javascript执行，capybara就可以工作。所有支持js的驱动程序都需要一些其他的框架（qt用于webkit，phantomjs用于poltergeist，firefox用于selenium），我将把它部署到一个heroku服务器上，在那里我无法真正安装这些库。