C++ 哪个布局引擎用于查找网页上html元素的坐标?

C++ 哪个布局引擎用于查找网页上html元素的坐标?,c++,html,webkit,gecko,C++,Html,Webkit,Gecko,我正在做一些web数据分类任务,并在考虑是否可以获得html元素在web浏览器上显示的坐标,而不考虑网页中引用的任何css或javascript 我的编程语言是c++,需要几百万页的结果,所以它必须很快。我知道有一个Microsoft COM组件,它在web浏览器控件中呈现页面,然后可以查询不同html标记的位置。但这不适合我的情况,因为它首先呈现整个页面,这占用了很多时间 正如我所发现的,有开源的布局引擎WebKit,Gecko可能可以用于此。但是,这是一段庞大的代码,我需要有人指导我找到合适

我正在做一些web数据分类任务,并在考虑是否可以获得html元素在web浏览器上显示的坐标,而不考虑网页中引用的任何css或javascript

我的编程语言是c++,需要几百万页的结果,所以它必须很快。我知道有一个Microsoft COM组件,它在web浏览器控件中呈现页面,然后可以查询不同html标记的位置。但这不适合我的情况,因为它首先呈现整个页面,这占用了很多时间

正如我所发现的,有开源的布局引擎WebKit,Gecko可能可以用于此。但是,这是一段庞大的代码,我需要有人指导我找到合适的类或模块,以便研究这些类或模块,或者有人以前做过的任何/类似的工作。另外,如果我想定制用于多线程的现有代码以使其更快,请告诉我你们认为什么是一个好的选择。
通常,您会发现不同的页面呈现引擎以各自的方式呈现html,结果也会有所不同

问题是,如果您坚持使用任何具体的浏览器引擎,您要做的就是以某种方式将此引擎引入到您的项目中,并使用引擎的界面检索这些坐标。这是一项艰巨的任务,因为你需要阅读大量的文档和浏览成千上万的文件

我认为正确的方法应该是在某个地方发布这个任务,这是您所选择的页面呈现引擎所特有的。(gecko/webkit/…)


如果您喜欢坚持使用特定于MS的内容,那么这可能会更容易,但在类名或代码块等方面却帮不上您的忙。在这种情况下,可能有其他人可以为您提供指导。

您难道没有HTML本身没有指定布局细节的问题吗(即,这完全取决于布局引擎的默认设置)?也许我忘了说,在我的情况下,元素相对于彼此的相对位置更重要,如果您注意到,大多数浏览器以几乎相似的方式呈现网页。因此,使用哪个渲染引擎并不重要,重要的是我得到了它渲染的元素的位置坐标。正如我所提到的,使用哪个渲染引擎或者它们是否以不同的方式渲染并不重要,重要的是它将渲染的元素的位置以及在我的代码中集成有多容易。我同意,我的结果会有偏差,因为我使用的引擎。我认为在各自的论坛上发布是个好主意。但我仍然愿意接受进一步的评论和建议。谢谢,忘了提及。。。我不太确定您的实际目标,但我认为,在深入研究web引擎的代码之前,您应该考虑渲染器之间的所有这些差异。因为即使是简单的html网页设计师也经常会做出不同的布局,为不同的浏览器应用补丁,等等。。。想象一下,当涉及JavaScript时,呈现会有多大的不同。甚至窗口宽度或浏览器工具栏的启用/禁用都可能影响元素的定位。我想在这种情况下,规划您的应用程序应该花费很多时间