跨hadoop实例移动部分数据

跨hadoop实例移动部分数据,hadoop,hive,Hadoop,Hive,我必须将某个数据块从一个hadoop集群复制到另一个集群。我编写了一个配置单元查询,将数据转储到hdfs中。将文件复制到目标集群后,我尝试使用命令“loaddatainpath'/a.txt'into table data”加载数据。我收到了以下错误消息 失败,异常为错误的文件格式。请检查文件的格式。 失败:执行错误,从org.apache.hadoop.hive.ql.exec.MoveTask返回代码1 我已将数据作为序列文件转储。有人能告诉我这里缺少什么吗?如果要在表中存储序列文件,在创建

我必须将某个数据块从一个hadoop集群复制到另一个集群。我编写了一个配置单元查询,将数据转储到hdfs中。将文件复制到目标集群后,我尝试使用命令“loaddatainpath'/a.txt'into table data”加载数据。我收到了以下错误消息

失败,异常为错误的文件格式。请检查文件的格式。 失败:执行错误,从org.apache.hadoop.hive.ql.exec.MoveTask返回代码1


我已将数据作为序列文件转储。有人能告诉我这里缺少什么吗?

如果要在表中存储序列文件,在创建表时应该使用存储为SEQUENCEFILE的
。您已经写下,您已经将数据转储为
序列文件
,但您的文件名是
a.txt
。我不明白

如果要将文本文件加载到期望序列文件作为数据源的表中,可以做一件事。首先创建一个普通表并将文本文件加载到此表中。然后做:

insert into table seq_table select * from text_table;