Open source 是否有经业务验证的云存储/Key=>;价值数据库?(开源)

Open source 是否有经业务验证的云存储/Key=>;价值数据库?(开源),open-source,amazon-ec2,cloud,key-value,Open Source,Amazon Ec2,Cloud,Key Value,我一直在寻找云计算/存储解决方案很长一段时间了(受Google Bigtable的启发)。但我找不到一个易于使用、业务就绪的解决方案 我正在搜索一个简单的、容错的、分布式的Key=>Value数据库,比如Amazon上的SimpleDB 我见过这样的事情: :简单、分布式、容错数据库。但它只理解JSON。没有XML连接器等 :漂亮的AmazonEC2接口。开放标准&XML。但分布式和容错性较差?还有很多关于XEN/VMWare问题的未决问题 :漂亮的分布式容错fs。但它很难配置。有java连接器

我一直在寻找云计算/存储解决方案很长一段时间了(受Google Bigtable的启发)。但我找不到一个易于使用、业务就绪的解决方案

我正在搜索一个简单的、容错的、分布式的Key=>Value数据库,比如Amazon上的SimpleDB

我见过这样的事情:

  • :简单、分布式、容错数据库。但它只理解JSON。没有XML连接器等
  • :漂亮的AmazonEC2接口。开放标准&XML。但分布式和容错性较差?还有很多关于XEN/VMWare问题的未决问题
  • :漂亮的分布式容错fs。但它很难配置。有java连接器吗
  • :很好的系统,比存储数据的能力强得多。使用自己的Hadoop分布式文件系统,并在具有2000个节点的集群上进行了测试
  • *:找不到开源替代方案!对于海量数据来说,这是一个不错但昂贵的系统。你对亚马逊上瘾了

  • 还有其他更好的解决方案吗?哪一个是最好的选择?哪一个提供的SOF(单点故障)最少?

    您可能想看看这个(使用MySQL作为键值存储):

    维基百科说雅虎()。因此,我想说,它对业务的起源很重要,尽管我不确定它是否算作K/V值数据库

    您的列表中没有使用的Friendfeed系统

    我很难理解你的优先次序。CouchDB是简单的、容错的和分布式的,但不知何故您将其排除在外,因为它没有XML。XML和Java连接器是否是未说明的需求

    (无论如何,CouchDB实际上应该被排除在外,因为它很年轻,它的API不稳定,而且它不是一个关键价值商店。)

    是一家将Apache Hadoop商业化的公司,当然还有一些附加值,比如产品化、配置、培训和支持服务。

    怎么样

    博客涵盖了这个问题;如果有一个开源的解决方案来满足你的需求,它肯定会在那里

    其他项目包括:

    • 林戈-
    另一个很好的列表:

    我使用谷歌的api,它是Xml的,免费的,文档化的,基于云的,并且有多种语言的连接器。我想如果你也想要免费托管的话,它会填补你的账单


    现在,如果你想拥有自己的服务器,答案是,它的key=>基于值,使用平面文件,是目前最快的数据库(与甲骨文相比非常简单,但非常擅长存储和访问数据,大约每秒100万条记录,大约有10字节的开销(取决于存储引擎))。TokyoCabinet是Mixi服务的核心,Mixi相当于日本的Facebook+MyPage,拥有数百万用户,所以它实际上是经过战斗验证的。

    你可能想看看哪个是模仿谷歌的bigtable的。

    而不是从谷歌的bigtable中寻找灵感——为什么不直接使用bigtable呢?你可以在Google App Engine上编写一个前端。

    如果你想要像Bigtable这样的东西,你不能超过或-它们都是开源的Bigtable克隆。但要考虑的一点是,你的需求对BigTabe来说真的够大了。它可以扩展到数千台平板电脑服务器,因此,它拥有相当多的基础设施来实现这一点(例如,处理常规节点故障的预期)

    如果你不期望至少增长几十个平板服务器,你可能想考虑其中一个提议:你不能简单地击败BelkyDB,或者MySQL无处不在。如果您只需要一个键/值数据存储,那么您可以在数据库接口周围放置一个简单的“dict”包装器,如果您的后端已经无法使用,则可以切换后端。

    使用CouchDB

    • JSON有什么问题
    • JSON到XML是微不足道的
    是另一个与CouchDB非常相似的选项,但使用与SQL非常相似的查询语言,而不是JavaScript中的map/reduce。它还支持索引、查询分析、复制和存储二进制数据


    它有大量的文档,一开始可能会让人不知所措,因此我建议您首先对存储工具进行良好的编译,以解决您的问题:


    由于它支持表模式、键值对和哈希表,因此也受到了一些关注。它使用Lua作为嵌入式脚本平台,使用HTTP作为通信协议。MySQL不能满足我的需要,因为它不是真正的分布式、容错的,并且大部分都有一个大型软件。用于Key=>Value平面文件存储的库可能比mysql(表大小等)好得多。在本文中,您可以看到它们以分布式非SOF方式使用mysql集群。嘿,也许平面文件更适合你的问题集,但我建议考虑Friendfeed和其他人正在做什么。也许Berkeley DB,你可以做复制。警告:我正在考虑使用Hadoop的HDFS来完成一个需要分布式文件系统的项目。当我发现他们仍然没有解决高可用性问题时,我立即放弃了这个想法——HDFS namenode机器是一个单点故障,没有定义的故障转移机制。有一个开源的插件兼容的SimpleDB替代品,名为M/DB:Congreats,你现在已经在wikipedia()上重复了2013次,祝你新年快乐:)我知道Mixi使用了几百台MySQL服务器。他们两者都用还是维基百科错了?我希望Hazlecast的人也能改进他们的数据库(flatfiles等)。Tokio Tryant/Tokio Cabinet是主/从或主/备用集群的。这不是真正的云方法;(如果你说的是可并行化的分布式操作和容错,那么速度不一定是交易杀手