Statistics NoSQL是存储统计数据的理想工具吗?

Statistics NoSQL是存储统计数据的理想工具吗?,statistics,nosql,Statistics,Nosql,我对NoSQL系统不是很熟悉,但我记得不久前读到过,它们非常适合处理统计数据 由于我即将开始编写代码来记录诸如“每天注册了多少用户”之类的数据,我想如果NoSQL符合要求的话,我可以借此机会进一步了解NoSQL 如果NoSQL确实非常适合这样做,您能给我提供一些关于原因的信息吗?哪些特定系统最适合这种特殊需求 所以,在第一个答案之后,也许进一步澄清一下是有帮助的 我目前有一个PostgreSQL数据库,我将从中获取数据。它将非常简单,并且不需要计算。例如,我将得到一个结果集,其中包含上个月每天注

我对NoSQL系统不是很熟悉,但我记得不久前读到过,它们非常适合处理统计数据

由于我即将开始编写代码来记录诸如“每天注册了多少用户”之类的数据,我想如果NoSQL符合要求的话,我可以借此机会进一步了解NoSQL

如果NoSQL确实非常适合这样做,您能给我提供一些关于原因的信息吗?哪些特定系统最适合这种特殊需求

所以,在第一个答案之后,也许进一步澄清一下是有帮助的

我目前有一个PostgreSQL数据库,我将从中获取数据。它将非常简单,并且不需要计算。例如,我将得到一个结果集,其中包含上个月每天注册的用户数量(因此它基本上只是日期/用户的一组值对),并将其保存在另一个表/数据库中


谢谢

这在某种程度上取决于您将对这些统计数据进行何种分析。如果你要做很多不同的操作(平均、求和、合并…),你可能会发现NoSQL解决方案更痛苦,那么它们是值得的

然而,如果您存储统计数据主要是为了显示目的,或者是为了非常特定的分析例程,那么NoSQL解决方案开始大放异彩

如果您的数据足够小,请坚持使用SQL解决方案,这将提供一个完整的查询引擎来处理的好处,但是如果您有很多值(每天一个值算不了什么,即使您运行了一百万年),并且担心存储大小和性能,那么NoSQL选项再次可能是值得的


如果您的数据是半结构化的,那么看看CouchDB,它提供了一些基本的索引和查询支持,可以为分析例程提供一些基础。如果您以很少的结构存储单个值,我的最佳建议是查看Tokyo Cabinet和Tokyo Tyrant,它们是绝对难以置信的键值存储选项。

NoSQL系统倾向于优化频繁存储数据但不频繁访问数据的情况。在统计的情况下,您可能会从一个(社交)站点频繁地收集大量数据,这些数据都经过了优化。但是检索和分析可能会慢一些。。。当然,这取决于您决定使用的“NoSQL”系统。< /P>某些NoSQL系统,但是如果考虑MyCask/MeMaCaseDB的情况,许多系统也针对完全相反的情况进行了优化。很多人使用Hadoop来处理NoSQL存储的内容并进行统计。您认为有一个具有~300 K行的表吗?(只有两列)在最坏的情况下,每分钟访问大约7次是否值得?绝对不值得…对于平均的RDBMS来说,30万行或多或少算不了什么…我假设一行是时间戳,它可能是你的聚集索引,任何数据库引擎都会对你运行的任何查询进行childsplay。谢谢!我想我必须找到一个使用NoSQL系统是一个很好的借口。大多数时候,当我的数据集超过10亿条记录时,我能够证明放弃SQL解决方案是合理的……任何比使用RDBMS管理得更好的数据都要少