Database 存储和导出几乎实时的点击流数据的最佳方法是什么

Database 存储和导出几乎实时的点击流数据的最佳方法是什么,database,database-design,mapreduce,large-data,Database,Database Design,Mapreduce,Large Data,假设我有一个网站,点击率很高。我需要将点击数据存储在一些数据库中,以便用于报告和监控目的。点击数据将包含诸如谁将用户推荐到此网站、用户来自何处、他们什么时候来等信息。 有没有一种方法可以存储并分析这些数据,比如说每隔10分钟一次,这样你就可以了解站点每10分钟的运行情况。什么类型的数据库最适合此目的,什么类型的分析工具可以从这些数据中快速生成有意义的信息。我正在考虑的一个分析选项是使用map reduce的一些变体来运行对这些数据的查询。尽管我还没有尝试过,但它看起来很有希望 引述: OpenT

假设我有一个网站,点击率很高。我需要将点击数据存储在一些数据库中,以便用于报告和监控目的。点击数据将包含诸如谁将用户推荐到此网站、用户来自何处、他们什么时候来等信息。
有没有一种方法可以存储并分析这些数据,比如说每隔10分钟一次,这样你就可以了解站点每10分钟的运行情况。什么类型的数据库最适合此目的,什么类型的分析工具可以从这些数据中快速生成有意义的信息。我正在考虑的一个分析选项是使用map reduce的一些变体来运行对这些数据的查询。

尽管我还没有尝试过,但它看起来很有希望

引述:

OpenTSDB是一个分布式、可扩展的数据库 写入的时间序列数据库(TSDB) HBase的顶端。OpenTSDB已写入 解决一个常见需求:存储、索引 并提供从 计算机系统(网络设备、, 操作系统、应用程序)在 大规模,并使这些数据更容易 易于接近和抓取


虽然我还没试过,但看起来很有希望

引述:

OpenTSDB是一个分布式、可扩展的数据库 写入的时间序列数据库(TSDB) HBase的顶端。OpenTSDB已写入 解决一个常见需求:存储、索引 并提供从 计算机系统(网络设备、, 操作系统、应用程序)在 大规模,并使这些数据更容易 易于接近和抓取


谢谢你的回复。我还遇到了hummingbird analytics(),它使用MongoDB存储此类数据。感谢您的回复。我还遇到了hummingbird analytics(),它使用MongoDB存储此类数据。