如何使用python从javascript生成的页面中提取文本?

如何使用python从javascript生成的页面中提取文本?,javascript,python,linux,selenium,Javascript,Python,Linux,Selenium,我正在寻找一种在Linux上编写脚本的方法,该脚本从Javascript生成的页面(特别是例如)中提取文本。理想情况下,我希望使用现有的工具,但还没有找到合适的工具(例如lynx,但它不支持javascript,或者Selenium,但它在浏览器中运行)。欢迎提出建议 如果没有合适的东西(对于这样一个简单的需求来说,这似乎很奇怪),也许我可以自己用Python编写一些东西。有什么有用的Python类可以用于类似的东西呢?一个选择是仍然坚持使用,但使用headless 另见: 示例(使用fi

我正在寻找一种在Linux上编写脚本的方法,该脚本从Javascript生成的页面(特别是例如)中提取文本。理想情况下,我希望使用现有的工具,但还没有找到合适的工具(例如lynx,但它不支持javascript,或者Selenium,但它在浏览器中运行)。欢迎提出建议


如果没有合适的东西(对于这样一个简单的需求来说,这似乎很奇怪),也许我可以自己用Python编写一些东西。有什么有用的Python类可以用于类似的东西呢?

一个选择是仍然坚持使用,但使用headless

另见:

示例(使用firefox webdriver):

印刷品:

Here is some text I'd like to scrape
 I wonder how to go about it?

我自己也不懂Javascript,它说它有一个Javascript API。不懂Javascript的人可以使用PhantomJS吗?@user3149905据我所知,您只需编写一段python代码即可从所需页面获取数据。你需要抓取的一个示例页面可以帮助我:)@alexce:在我看来,PhantomJS就像是我必须检查一个页面上的JS对象,然后查询它们,或者诸如此类的东西,但我没有深入研究API。这是我刚刚创建的一个特定的示例页面,我希望能够抓取它:我特别希望该页面上的日期。@Alexe:如果我理解正确,是的,我只是在编写python代码,但我在反思JS代码,所以我需要知道JS是如何构造的,以及它是如何工作来理解结果的。我不:)@user3149905您只需要通过id(或xpath,或名称,或其他-)获取必要的元素。请参阅答案的更新。
Here is some text I'd like to scrape
 I wonder how to go about it?