如何使用python从javascript生成的页面中提取文本？_Javascript_Python_Linux_Selenium

如何使用python从javascript生成的页面中提取文本？

javascript python linux selenium

如何使用python从javascript生成的页面中提取文本？,javascript,python,linux,selenium,Javascript,Python,Linux,Selenium,我正在寻找一种在Linux上编写脚本的方法，该脚本从Javascript生成的页面（特别是例如）中提取文本。理想情况下，我希望使用现有的工具，但还没有找到合适的工具（例如lynx，但它不支持javascript，或者Selenium，但它在浏览器中运行）。欢迎提出建议如果没有合适的东西（对于这样一个简单的需求来说，这似乎很奇怪），也许我可以自己用Python编写一些东西。有什么有用的Python类可以用于类似的东西呢？一个选择是仍然坚持使用，但使用headless 另见：示例（使用fi

我正在寻找一种在Linux上编写脚本的方法，该脚本从Javascript生成的页面（特别是例如）中提取文本。理想情况下，我希望使用现有的工具，但还没有找到合适的工具（例如lynx，但它不支持javascript，或者Selenium，但它在浏览器中运行）。欢迎提出建议

如果没有合适的东西（对于这样一个简单的需求来说，这似乎很奇怪），也许我可以自己用Python编写一些东西。有什么有用的Python类可以用于类似的东西呢？

一个选择是仍然坚持使用，但使用headless

另见：

示例（使用firefox webdriver）：

印刷品：

Here is some text I'd like to scrape
 I wonder how to go about it?

我自己也不懂Javascript，它说它有一个Javascript API。不懂Javascript的人可以使用PhantomJS吗？@user3149905据我所知，您只需编写一段python代码即可从所需页面获取数据。你需要抓取的一个示例页面可以帮助我：）@alexce：在我看来，PhantomJS就像是我必须检查一个页面上的JS对象，然后查询它们，或者诸如此类的东西，但我没有深入研究API。这是我刚刚创建的一个特定的示例页面，我希望能够抓取它：我特别希望该页面上的日期。@Alexe:如果我理解正确，是的，我只是在编写python代码，但我在反思JS代码，所以我需要知道JS是如何构造的，以及它是如何工作来理解结果的。我不：）@user3149905您只需要通过id（或xpath，或名称，或其他-）获取必要的元素。请参阅答案的更新。

Here is some text I'd like to scrape
 I wonder how to go about it?