Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/419.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 需要知道页面的主DIV_Javascript_Jquery_Html_Web - Fatal编程技术网

Javascript 需要知道页面的主DIV

Javascript 需要知道页面的主DIV,javascript,jquery,html,web,Javascript,Jquery,Html,Web,我试图想出一个策略来检测网站的主要内容DIV。主内容div是指:包含站点的页眉、正文和页脚的div 检测它是一个非常困难和缓慢的过程 例如,在上,我会检测id=“bodyWrapper”或“minWidthInbox”,因为这些div包含站点上的主要内容 我也尝试了许多算法来实现这一点。但由于站点结构怪异,且不一致,不可能所有站点都通过单一算法运行 表格布局尤其难以检测:-( 我该如何解决这个问题呢?你应该看看可读性。他们开发了一种算法来提取网页内容并删除所有其他元素,如页眉、页脚和广告 不幸的

我试图想出一个策略来检测网站的主要内容DIV。主内容div是指:包含站点的页眉、正文和页脚的div

检测它是一个非常困难和缓慢的过程

例如,在上,我会检测id=“bodyWrapper”或“minWidthInbox”,因为这些div包含站点上的主要内容

我也尝试了许多算法来实现这一点。但由于站点结构怪异,且不一致,不可能所有站点都通过单一算法运行

表格布局尤其难以检测:-(


我该如何解决这个问题呢?

你应该看看可读性。他们开发了一种算法来提取网页内容并删除所有其他元素,如页眉、页脚和广告

不幸的是,他们的算法不再是公共的。他们在这里有一个API:

还有一些原始算法的实现,我在Python的库中使用过,在NodeJS中使用过一个(https://github.com/arrix/node-readability)它们工作得很好


关于你关于主分区的问题,除非你放弃一个特定的网站,否则我不建议你搜索这样一段特定的代码。在我看来,你是在寻找内容,当然,网站的html代码可以包含几乎所有内容,而不仅仅是主分区。

你应该看看可读性。他们开发了一种算法来提取网页内容,并删除所有其他元素,如页眉、页脚和广告

不幸的是,他们的算法不再是公共的。他们在这里有一个API:

还有一些原始算法的实现,我在Python的库中使用过,在NodeJS中使用过一个(https://github.com/arrix/node-readability)它们工作得很好


关于你关于主分区的问题,除非你放弃一个特定的网站,否则我不建议你搜索这样一段特定的代码。在我看来,你是在寻找内容,当然,网站的html代码可以包含几乎所有的内容,而不仅仅是主分区。

所以你希望网站的内容在div?你到底想达到什么目的?迟钝地发现什么?甚至无法理解你想做什么。抱歉!!这么有趣的问题。请不要再投他的反对票,让他编辑问题。@Lenny,我不需要内容,但我需要div(id/name)关于包含内容的div。请解释为什么否决?问题并不是那么有趣。如果不理解,请询问您的疑问。那么您想要在div中包含网站的内容?您实际想要实现什么?缓慢检测什么?甚至无法理解您试图做什么。抱歉!!这么有趣的问题。请不要再否决他,让他编辑这个问题。@Lenny,我不需要内容,但我需要div(id/name)关于含有内容的div。请解释为什么投票被否决?这个问题并没有那么有趣。如果不明白,请询问您的疑问。酷thanx man。投票被否决。至少您没有像其他人一样投票被否决。我对这个团体寄予厚望,但不是现在。人们因为问“为什么我们在循环中使用我作为计数器”而投票被否决但不鼓励提出有效的问题。alex,我正在为类似的pattered站点(如2 columnar)创建algo。这样我就可以正确解析至少50%的站点。嗨,Johnny,欢迎使用Stack Overflow!虽然我对这个问题投了赞成票,但请不要乞求其他人对你的帖子投赞成票。相反,请慢慢来,尽可能清楚地写。注意投票结果如何在我编辑了你的文章并整理了语法之后,你的问题开始出现了。这确实是一个有趣的问题,它只是隐藏在许多难以理解的混乱之中。;)祝你好运!酷thanx man.投票吧..至少你没有像其他人一样投票吧.我对这群人寄予厚望,但不是现在.人们会因为问“为什么我们在循环中使用I作为计数器”而投票,但有效的问题是不被鼓励的..alex,我正在为类似的pattered站点创建算法,比如2 columnar.这样我就可以正确解析至少50%的站点.嗨,Johnny,欢迎来到堆栈溢出!虽然我对这个问题投了赞成票,但请不要乞求别人对你的帖子投赞成票。相反,慢慢来,尽量写清楚。注意到在我编辑了你的帖子并清理了语法之后,你的问题开始出现了投票结果吗?这的确是一个有趣的问题,它被隐藏在许多难以理解的混乱之中祝你好运