Hadoop 从配置单元连接到现有数据库(在HDFS上)

Hadoop 从配置单元连接到现有数据库(在HDFS上),hadoop,hive,Hadoop,Hive,我在HDFS Hadoop文件系统上有一个数据库和一个模式文件 我正在尝试从配置单元连接到此现有数据库 非常感谢任何指针。不确定您所说的数据库是什么意思,但使用Hive的功能,这相当容易。您将需要3样东西:数据的位置,用于读写数据行的InputOutputFormat,以及可能用于解释数据列的SerDe。如果您需要保持您的配置单元模式和外部模式同步,那么没有现成的方法。您必须编写一些自定义代码来监视源架构,并在架构更改时修改配置单元架构。虽然不是琐碎的,但这也很容易做到

我在HDFS Hadoop文件系统上有一个数据库和一个模式文件

我正在尝试从配置单元连接到此现有数据库


非常感谢任何指针。

不确定您所说的数据库是什么意思,但使用Hive的功能,这相当容易。您将需要3样东西:数据的位置,用于读写数据行的InputOutputFormat,以及可能用于解释数据列的SerDe。如果您需要保持您的配置单元模式和外部模式同步,那么没有现成的方法。您必须编写一些自定义代码来监视源架构,并在架构更改时修改配置单元架构。虽然不是琐碎的,但这也很容易做到