Html 解析内存中的DOM?

Html 解析内存中的DOM?,html,dom,webkit,browser,Html,Dom,Webkit,Browser,我已经完成了HTML解析。我得到一个URL,使用Nokogiri我可以从HTML中提取组件。那很好 现在,我想知道以下是可能的还是根本没有意义: 当我们查看浏览器时,有一个渲染引擎可以解析HTML/CSS/JS并创建它的视觉表示。我想知道是否有可能访问内存中的DOM解释。例如,当解析一个HTML时,我可以找到一个距离根元素很远的元素,但是当呈现它时,它可以出现在页面的顶部(因为CSS说它是绝对定位的)。我希望能够获得浏览器上显示的图像 是否有任何开源API可以让我访问HTML文件的这种解释,或者

我已经完成了HTML解析。我得到一个URL,使用Nokogiri我可以从HTML中提取组件。那很好

现在,我想知道以下是可能的还是根本没有意义:

当我们查看浏览器时,有一个渲染引擎可以解析HTML/CSS/JS并创建它的视觉表示。我想知道是否有可能访问内存中的DOM解释。例如,当解析一个HTML时,我可以找到一个距离根元素很远的元素,但是当呈现它时,它可以出现在页面的顶部(因为CSS说它是绝对定位的)。我希望能够获得浏览器上显示的图像


是否有任何开源API可以让我访问HTML文件的这种解释,或者我说的根本没有意义,因为我们看到的只是无法处理的可视对象?

听起来你在要求一个无头浏览器——一个为你的代码而不是用户工作的渲染引擎。

看看。

来自什么环境?标准浏览器DOM API会告诉您这一点。这只是将CSS应用于DOM的一个可见结果。@SLaks,我愿意创建一个Ruby程序,让我按照用户看到的方式解析DOM,而不是按照HTML本身的组织方式来解析。@Barmar所以,没有“方法”我可以通过编程正确地解析它?@HommerSmith:那么你想要一个能够为元素找到应用CSS属性的渲染引擎?使用幻影。