Database 可扩展的简单键值数据库

Database 可扩展的简单键值数据库,database,database-design,database-schema,Database,Database Design,Database Schema,我一直在研究不同的键值数据库(Mongo、Cassandra等),并试图找出对于非常简单的数据存储来说,哪种最有利于速度和效率。在很多情况下,这似乎是关键价值,但价值更为复杂。我只希望键是一个字符串(散列),值是一个整数值,所以我不需要这些数据库有很多额外的东西。例如,除了字符串键和整数值之外,我不存储文档、json或任何复杂的东西 我目前的(MySQL)数据库有大约10亿条记录,我希望将其转移到一个更合适的环境中,这样我就可以获得超过1万亿条记录,而不会出现MySQL届时会出现的扩展性和性能问

我一直在研究不同的键值数据库(Mongo、Cassandra等),并试图找出对于非常简单的数据存储来说,哪种最有利于速度和效率。在很多情况下,这似乎是关键价值,但价值更为复杂。我只希望键是一个字符串(散列),值是一个整数值,所以我不需要这些数据库有很多额外的东西。例如,除了字符串键和整数值之外,我不存储文档、json或任何复杂的东西

我目前的(MySQL)数据库有大约10亿条记录,我希望将其转移到一个更合适的环境中,这样我就可以获得超过1万亿条记录,而不会出现MySQL届时会出现的扩展性和性能问题(另外,如果MySQL是非常简单的键值,则不需要MySQL)


因此,问题是,对于一个非常简单的键值数据库结构,哪种数据库最适合实现最大性能/扩展能力?

您需要更多的指标。你的键有多大,它们真的只是整数(32位?)。最重要的是写和读的次数,平均负载是多少,峰值负载是多少。现在关键是md5哈希。然而,我可以在构建这个数据库时选择任何最有效的哈希算法(因此,如果有区别的话,它可以是整数)。该数据库将建立到1-10万亿条记录,然后主要是只读的。目前,当前数据库每秒只处理5-10k查询,尽管这个数字可能会上升到接近每秒50k-100k查询的数字。就目前而言,我的负载非常低(尽管目前所有的东西都在SSD上,对于更大的DB来说,这在经济上可能不实用)。