使用Selenium获取DIV的内容,该DIV';它充满了javascript

使用Selenium获取DIV的内容,该DIV';它充满了javascript,javascript,dom,html,selenium,Javascript,Dom,Html,Selenium,我正在使用Selenium自动加载《纽约时报》一篇文章的所有评论。一旦它们被加载,我想获取注释并存储这些信息以供以后使用。然而,当查看本文的源代码时,我看到comments DIV是空的,因此NYT可能使用javascript实时动态地用注释填充它。由于注释不在源代码中,我不确定如何获得注释的代码,因为我在Firebug中看到了它。我想我想要的是DOM,但任何帮助都将不胜感激 谢谢 var content = document.getElementById('myDivId').innerHTM

我正在使用Selenium自动加载《纽约时报》一篇文章的所有评论。一旦它们被加载,我想获取注释并存储这些信息以供以后使用。然而,当查看本文的源代码时,我看到comments DIV是空的,因此NYT可能使用javascript实时动态地用注释填充它。由于注释不在源代码中,我不确定如何获得注释的代码,因为我在Firebug中看到了它。我想我想要的是DOM,但任何帮助都将不胜感激

谢谢

var content = document.getElementById('myDivId').innerHTML;

这基本上就是从html元素中检索html内容的方法。

对selenium没有帮助。@epascarello:为什么没有?您可以始终使用Selenium的
getEval
方法来执行页面上的那段javascript。当getEval内置了获取内容的方法时,为什么要使用getEval呢?@epascarello:是否需要详细说明?@slebetman:一个问题是,不是每个元素都显式地具有“id”属性,我不知道如何获取浏览器内部生成的id(如果存在这样的东西)。但在某些情况下,如果“id”是显式的/已知的,这可能会有所帮助。使用Web驱动程序?你知道他们是怎么装的吗?它依赖于滚动位置吗?使用IDE,但我想我可能需要切换到Web驱动程序来实现这些目的。不知道他们是如何加载的,但我的教授认为可能是javascript。滚动位置似乎不是问题。