Rss 以编程方式确定一篇博客文章有多少评论

Rss 以编程方式确定一篇博客文章有多少评论,rss,comments,Rss,Comments,确定一篇博客文章有多少评论最有效的方法是什么?我们想为新的web应用程序存储数据。我们有一个永久链接URl的列表以及RSS提要 如果博客由您控制,那么从postID=2的评论中选择countcommentid可能是最好的选择。如果您只有URL,但它仍然是您的blog/db,则需要创建一个子查询,其中postd=从permalink=URL的帖子中选择whatever,或者以任何方式从URL将评论加入帖子 如果它是一个远程博客,那么每个博客都有不同的HTML。本质上,您需要构建一个解析器来解析HT

确定一篇博客文章有多少评论最有效的方法是什么?我们想为新的web应用程序存储数据。我们有一个永久链接URl的列表以及RSS提要

如果博客由您控制,那么从postID=2的评论中选择countcommentid可能是最好的选择。如果您只有URL,但它仍然是您的blog/db,则需要创建一个子查询,其中postd=从permalink=URL的帖子中选择whatever,或者以任何方式从URL将评论加入帖子

如果它是一个远程博客,那么每个博客都有不同的HTML。本质上,您需要构建一个解析器来解析HTML并查找重复元素,如div class=comment。但对于每个不同的博客来说,这将主要是一项体力劳动

有些博客可能有更好的方式,比如在HTML或某些界面中的某个地方进行评论计数,但我不知道有任何标准化的方式


编辑:如果你有一个评论RSS提要,你可能会幸运地使用一种计算XML节点数的机制,比如XPath。

如果博客是由你控制的,那么从postID=2的评论中选择countcommentid可能是最好的选择。如果您只有URL,但它仍然是您的blog/db,则需要创建一个子查询,其中postd=从permalink=URL的帖子中选择whatever,或者以任何方式从URL将评论加入帖子

如果它是一个远程博客,那么每个博客都有不同的HTML。本质上,您需要构建一个解析器来解析HTML并查找重复元素,如div class=comment。但对于每个不同的博客来说,这将主要是一项体力劳动

有些博客可能有更好的方式,比如在HTML或某些界面中的某个地方进行评论计数,但我不知道有任何标准化的方式


编辑:如果你有一个评论RSS提要,你可能会幸运地使用一种计算XML节点数的机制,比如XPath。

如果我理解正确,你需要一种启发式方法来估计已知为博客文章的HTML页面中的评论数,是吗

很多时候,一个特定的博客会有一些功能,使它很容易工作。如果你仔细看我的博客,你会发现所有有评论的页面上都写着“X回复”,所以如果你能够在每个博客的基础上做一些工作,这可能并不难

如果您需要一些通用的东西,我想评论中有一些常见的特性,您可能可以检测到。首先,它们中的任何链接都很可能具有rel=nofollow属性,因此在一个块中看到它可能意味着它是一条注释

要寻找的主要有趣的事情是同一站点上m的帖子结构的变化。例如,每个评论都有自己的锚,这样人们就可以直接链接到它,这样你就可以查看同一站点上给定页面中不同数量的标签,从而了解评论的相对数量

正如MichaelStum所指出的,如果页面上有一个评论RSS提要,你的生活就会变得简单得多,因为你可以以结构化的格式获取评论数据


总而言之,我认为这将是一个非常具有挑战性的问题,一般来说要解决。

如果我理解正确,你想要一个启发式方法来估计一个HTML页面中的评论数量,这是已知的博客文章,是吗

很多时候,一个特定的博客会有一些功能,使它很容易工作。如果你仔细看我的博客,你会发现所有有评论的页面上都写着“X回复”,所以如果你能够在每个博客的基础上做一些工作,这可能并不难

如果您需要一些通用的东西,我想评论中有一些常见的特性,您可能可以检测到。首先,它们中的任何链接都很可能具有rel=nofollow属性,因此在一个块中看到它可能意味着它是一条注释

要寻找的主要有趣的事情是同一站点上m的帖子结构的变化。例如,每个评论都有自己的锚,这样人们就可以直接链接到它,这样你就可以查看同一站点上给定页面中不同数量的标签,从而了解评论的相对数量

正如MichaelStum所指出的,如果页面上有一个评论RSS提要,你的生活就会变得简单得多,因为你可以以结构化的格式获取评论数据


总而言之,我认为这将是一个非常具有挑战性的问题,一般来说要解决。

博客几乎总是有一个用于评论的RSS提要。如果你有,那么你可以确定评论的确切数量,因为99%的反馈都遵循一个标准。即使这个博客是你自己的,如果你已经在生成一个RSS提要,那么不要费心去调用你的数据库。你已经去了
d使用它来生成提要,因此只需遍历XML节点是有意义的。这样,您就不需要额外的开销,这取决于您希望获取这些信息的频率。

博客几乎总是有一个用于评论的RSS提要。如果你有,那么你可以确定评论的确切数量,因为99%的反馈都遵循一个标准。即使这个博客是你自己的,如果你已经在生成一个RSS提要,那么不要费心去调用你的数据库。您已经这样做了,以生成提要,因此只需遍历XML节点就可以了。这样,您就不会有额外的开销,这取决于您希望获取此信息的频率