Algorithm 信息检索:一个时间范围内的URL点击

Algorithm 信息检索:一个时间范围内的URL点击,algorithm,information-retrieval,Algorithm,Information Retrieval,算法挑战: 问题陈述: 你如何为谷歌这样的东西设计一个日志系统,你应该能够查询URL在两个时间范围内被打开的次数 i/p:开始时间、结束时间、URL1 o/p:在开始和结束时间之间打开URL1的次数 一些规格: 数据库不是最佳解决方案 对于给定的时间戳,URL可能已打开多次。 URL可能在两个时间戳内被多次打开。 开始时间和结束时间可以相隔一个月。 时间可以精确到一秒。一种解决方案: 杂凑 关键值 URL哈希---->T1频率 例如: Amazon哈希-->T CumFreq 上午11:00 3

算法挑战:

问题陈述: 你如何为谷歌这样的东西设计一个日志系统,你应该能够查询URL在两个时间范围内被打开的次数

i/p:开始时间、结束时间、URL1 o/p:在开始和结束时间之间打开URL1的次数

一些规格: 数据库不是最佳解决方案 对于给定的时间戳,URL可能已打开多次。 URL可能在两个时间戳内被多次打开。 开始时间和结束时间可以相隔一个月。 时间可以精确到一秒。

一种解决方案:

杂凑

关键值 URL哈希---->T1频率

例如:

Amazon哈希-->T CumFreq 上午11:00 3(上午11:00开放3次) 上午11点15分4(上午11点15分开放1次,cumfreq为3+1=4) 上午11:30 11(上午11:30开放4次,cumfreq为3+4+4=11) i/p:11:10,上午11:37,亚马逊

通过减去最后一个时间戳小于11:10(上午11:00)和最后一个活动时间戳小于11:37(上午11:30),可以获得o.p。因此,结果是 11-3=8

我们能做得更好吗