跟踪RSS订户的标准可靠方法?

跟踪RSS订户的标准可靠方法?,rss,Rss,在不使用Feedburner的情况下,可靠跟踪RSS订户的最佳方法是什么?一些显而易见的方法,如通过IP或点击次数进行跟踪,都存在一些fata缺陷。IP地址可以随每个请求而更改,或者多个用户可以使用同一IP。此外,提要阅读器可以每天甚至每小时多次请求提要。这两个问题都使得获得唯一订户的可靠统计数据变得非常困难 我读过这两位作者的文章,但他们的建议似乎都不能真正解决如何准确可靠地跟踪订阅者的问题。Leo建议在每次加载引用页面时,通过编程生成一个唯一的ID附加到RSS提要URL。Tim提倡让RSS阅

在不使用Feedburner的情况下,可靠跟踪RSS订户的最佳方法是什么?一些显而易见的方法,如通过IP或点击次数进行跟踪,都存在一些fata缺陷。IP地址可以随每个请求而更改,或者多个用户可以使用同一IP。此外,提要阅读器可以每天甚至每小时多次请求提要。这两个问题都使得获得唯一订户的可靠统计数据变得非常困难


我读过这两位作者的文章,但他们的建议似乎都不能真正解决如何准确可靠地跟踪订阅者的问题。Leo建议在每次加载引用页面时,通过编程生成一个唯一的ID附加到RSS提要URL。Tim提倡让RSS阅读器生成一个独特的标签,并提出了从跟踪推荐人到使用cookie的建议。一个唯一的URL是可靠的,但它有两个缺陷:它不是一个用户友好的URL,它为SEO创建了重复的内容。有没有其他可靠的方法来跟踪RSS订阅者?Feedburner是如何估计订户的?

您可以查询web服务器日志以获取RSS源的流量,也许可以通过IP对其进行过滤以获得Unique的数量


问题是,这将依赖于人们每天检查饲料。一个人对RSS提要的点击频率每天都会有所不同,而且数量可能会更低。

这并没有一个真正的标准方法。用户计数总是不可靠的,但你可以通过它得到很好的估计

下面是Google是如何做到的():

订户计数是通过匹配IP地址和提要读取器来计算的 组合,然后使用我们对大量 市场上的阅读器、聚合器和机器人可以做出更多的推断

当然,这一部分对谷歌来说很容易,因为他们可以首先计算有多少谷歌阅读器用户订阅了相关的提要。之后,他们还使用IP地址匹配,这也是您应该使用的

您可以从web服务器日志中计算单个IP地址(即唯一的),但如果10个人都使用相同的地址,则将其计算为1。这就是为什么您应该检查客户端发送的HTTP头,更具体地说是头字段和
HTTP\u VIA
。您可以使用
HTTP\u VIA
地址作为“主”地址,然后计算订阅源的
HTTP\u X\u转发的
地址的数量。如果订户没有这些添加代理的字段,那么它将被计算为唯一的IP地址。这些应该在生成提要的代码中处理。您还可以为IP添加GeoIP查找,并将所有内容存储到数据库中。这将允许您查看哪个国家的订阅源最多


这也有问题。所有代理都不使用这些字段,也不能解决NAT网关后计算订户的问题。然而,这是一个很好的估计。此外,你可能更感兴趣的是数量级,而不是用户的确切数量,不是吗?如果计数器显示您有5989个订阅者,则可能会有更多订阅者,因为计数器给出了下限。

如果您将RSS源配置为需要某种身份验证,则可以执行基于用户的度量,而不是基于ip的度量。尽管这在技术上是一个正确的解决方案,但让人们选择在除Intranet场景之外的任何场景中使用经过身份验证的博客都是一种延伸。

标准和可靠并不完全是RSS字典中的单词:-)要记住,多少年后,这个东西甚至没有标准XSD?如果你所说的跟踪是指“计数”,那么你可以做一些事情,战术取决于目的,即展示一个大数字还是一个小数字?这是一个营销的东西,所以你必须定义你的目标:-)

您可能需要首先对IP号码进行分类,以获得大/公司/伞式IP号码的基本集合。对于他们来说,你可以使用referer作为一个合理的筛选标准,并将所有其他内容都视为唯一的,除非另有证明。绝大多数IP号码在大约2天内保持稳定,但同样地,使用基本的推荐逻辑作为过滤器来过滤那些只是不断“点击”的人总是很好的

然后你需要一个合适的聚合器列表和一个关于它们如何处理URL的分类,如果它们完全模糊了最终读者,那么你需要公布或推断的平均值——使用平均数的公平分布总是公平的。使用cookie可能有助于收集聚合器IP,并区分自动代理和个人


一件非常重要的事情是要记住,你不能只使用一种方法,而期望它是一颗银弹——你需要同时使用这3-4个方面,再加上基本的统计推理。

谢谢你的建议。不过,这种方法存在一些问题。IP地址可以随每个请求而更改,或者多个用户可以使用同一IP。此外,提要阅读器可以每天甚至每小时多次请求提要。这两个问题都使得获得唯一订户的可靠统计数据变得非常困难。这将是理想的,但不幸的是,身份验证并不是大多数订阅源在野外工作的方式。我甚至不确定大多数RSS阅读器是否支持这样的功能。为站点的每个订阅用户生成唯一的xml文件,例如:www.site.com/RSS/12345/;因此,使用xml头类型用php生成xml&按时间跟踪它()!这可能是计算对RSS的唯一访问的安全方法。我觉得很激烈,但可以操作!;)