Hive SQOOP:在导出到postgress DB之前自定义输入数据
我想通过sqoop将输入数据从hdfs导出到postgress db。 当我的输入数据与postgress表的格式正确时,我就能够实现这一点 但我想在将输入数据导出到db之前对其执行一些操作,比如说,我想在输入数据之前对每个值添加一些no 那么,sqoop是否提供了任何这样的API来实现这一点呢Hive SQOOP:在导出到postgress DB之前自定义输入数据,hive,hadoop2,sqoop,sqoop2,Hive,Hadoop2,Sqoop,Sqoop2,我想通过sqoop将输入数据从hdfs导出到postgress db。 当我的输入数据与postgress表的格式正确时,我就能够实现这一点 但我想在将输入数据导出到db之前对其执行一些操作,比如说,我想在输入数据之前对每个值添加一些no 那么,sqoop是否提供了任何这样的API来实现这一点呢 sqoop版本:1.4.6sqoop在导出时不支持任何操作。它只是以导出目录作为输入。您可以使用pig/hive对导入的数据执行一些操作,输出数据集可以导出回postgress数据库
sqoop版本:1.4.6sqoop在导出时不支持任何操作。它只是以导出目录作为输入。您可以使用pig/hive对导入的数据执行一些操作,输出数据集可以导出回postgress数据库