Hadoop 我们可以在hdfs中存储关系数据吗

Hadoop 我们可以在hdfs中存储关系数据吗,hadoop,hdfs,Hadoop,Hdfs,我正在尝试转换一个以关系数据库为后端的应用程序。我可以将数据关系也存储在HDFS中吗?任何文件都可以存储在HDFS中。但是,如果您想要SQL类型的DB,您应该选择HBASE。如果您直接将数据存储到HDFS中,您将无法存储合理性。仅为了存储,您可以在HDFS中存储任何内容。但这毫无意义。首先,您不应该认为Hadoop是RDBMS的替代品(您正在尝试这样做)。两者的目的完全不同。Hadoop并不适合您的事务、关系或实时需求。它旨在满足您的脱机批处理需求。因此,最好正确地分析您的用例,然后冻结您的决策

我正在尝试转换一个以关系数据库为后端的应用程序。我可以将数据关系也存储在HDFS中吗?

任何文件都可以存储在HDFS中。但是,如果您想要SQL类型的DB,您应该选择HBASE。如果您直接将数据存储到HDFS中,您将无法存储合理性。

仅为了存储,您可以在HDFS中存储任何内容。但这毫无意义。首先,您不应该认为Hadoop是RDBMS的替代品(您正在尝试这样做)。两者的目的完全不同。Hadoop并不适合您的事务、关系或实时需求。它旨在满足您的脱机批处理需求。因此,最好正确地分析您的用例,然后冻结您的决策

作为一个建议,我想告诉你。它在现有Hadoop集群的基础上为您提供仓储功能。它还为您的仓库提供了一个类似SQL的接口,如果您来自SQL后台,这将使您的生活更加轻松。但同样,Hive也是一个批处理系统,如果您需要实时处理,它并不适合

不过,正如阿比纳夫所建议的,你可以看看。它是一个可以在Hadoop集群上运行的数据库,为您提供对数据的随机、实时读/写访问。但是你应该记住一件事,那就是它是一个NoSQL数据库。它不遵循SQL术语和约定。所以,一开始你可能会觉得有点陌生。您可能需要考虑一些问题,例如如何将数据存储在新的存储样式(列式)中,而不是RDBMS的行式存储。否则,设置和使用它不是问题


HTH

您应该添加他如何将关系数据存储到诸如HBase之类的列式存储器中。