为什么sql垂直可扩展,而nosql水平可扩展

为什么sql垂直可扩展,而nosql水平可扩展,sql,scalability,horizontal-scaling,nosql,Sql,Scalability,Horizontal Scaling,Nosql,我是NoSQL的新手,正在努力理解它的含义 我在许多不同的网站上看到过许多文章重复这样的事实:“SQL数据库是垂直扩展的(通过添加CPU/内存),而NoSQL数据库是水平扩展的(通过添加更多可以执行分布式计算的机器)” 例如这些文章: 问题是我不明白为什么 据我所知,SQL和NoSQL之间的主要区别(除了可伸缩性问题)是SQL存储在表中,而NoSQL则以不同的方式(键值/图形/xml等)存储 我似乎无法理解这两个事实(可伸缩性和存储策略)之间的联系。这些似乎与我无关(可能是因为缺乏理解)。评

我是NoSQL的新手,正在努力理解它的含义

我在许多不同的网站上看到过许多文章重复这样的事实:“SQL数据库是垂直扩展的(通过添加CPU/内存),而NoSQL数据库是水平扩展的(通过添加更多可以执行分布式计算的机器)”

例如这些文章:

问题是我不明白为什么

据我所知,SQL和NoSQL之间的主要区别(除了可伸缩性问题)是SQL存储在表中,而NoSQL则以不同的方式(键值/图形/xml等)存储


我似乎无法理解这两个事实(可伸缩性和存储策略)之间的联系。这些似乎与我无关(可能是因为缺乏理解)。

评论太长了,我承认其中包含了一些观点

这些条款一般都是合理的。正如两篇文章所指出的,NoSQL技术和SQL技术(因为没有更好的术语)在当今都扮演着重要的角色。这一讨论有点让人想起层次数据库与关系数据库,曾几何时

我不同意这种差异。讨论中忽略了Hive、PrestoDB和BigQuery等技术,这些技术基于传统RDBMS的高度可扩展技术

在我看来,RDBMS和NoSQL之间的主要区别在于ACID遵从性和数据结构。第一个是关系数据库带来的“负担”,不管是好是坏——对于金融交易来说绝对是方便的,但对于其他目的来说,这是以开销为代价的。第二个领域是传统数据库正朝着更好地处理非结构化数据的方向发展,直接支持嵌套表、JSON和XML格式。然而,结构是很重要的,因为大量的数据科学家可能在与数据交互的过程中艰难地学习

大型可伸缩键值数据库的设计考虑了“水平”可伸缩性。再加上缺乏纯ACID属性,有助于为新硬件重新平衡数据——假设数据库设计正确(这可能是一个很大的假设)

Oracle、DB2和Teradata等数据库几十年来一直支持并行处理(尽管更倾向于单一服务器,尽管没有共享架构)。他们的技术比更现代的基于Apache的系统更早(因为没有更好的术语),但这并不意味着他们不能跨多个处理器扩展


Hive、Redshift、BigQuery和PrestoDB等新数据库提供了更现代的“水平”可扩展意义上的基于SQL的接口(至少对于查询)。Postgres世界正在进行大量工作以支持并行处理,例如Greenplum、Netezza、Vertica、,因此,关系数据库不能跨多个独立处理器进行扩展的想法是错误的。

现代SQL数据库和NoSQL数据库都可以利用多个处理器和多个磁盘。两者通常都可以利用更多的内存。对于这两种配置,向现有配置添加新硬件时可能会出现问题,但这取决于数据库。在高层次上,这些文章是误导性的,或者你的解释是不完整的。谢谢你的回答。我添加了文章。也许你可以看看这些文章是否真的有误导性,或者是我的解释不好。