Hadoop 删除配置单元外部表中的行

Hadoop 删除配置单元外部表中的行,hadoop,hive,Hadoop,Hive,我将文本文件加载到配置单元外部表中。该文本文件有一个分隔符/,用于区分列。此外,某些列在一列中具有新行字符。因此,存储在外部表中的数据不匹配。在我的例子中,唯一键是row\u id,它包含1\u 234之类的值行ID是数字。但由于文本文件中有新行字符,某些行在行id中有文本 有没有办法删除配置单元中的这些行,或者如何删除hdfs中文本文件中的新行字符?在加载到配置单元之前,您必须编写一个hadoop(流式处理是一个选项)作业来清理数据 在加载到Hive之前,您必须编写一个hadoop(流式处理是

我将文本文件加载到配置单元外部表中。该文本文件有一个分隔符
/
,用于区分列。此外,某些列在一列中具有新行字符。因此,存储在外部表中的数据不匹配。在我的例子中,唯一键是
row\u id
,它包含
1\u 234
之类的值<代码>行ID是数字。但由于文本文件中有新行字符,某些行在
行id
中有文本


有没有办法删除配置单元中的这些行,或者如何删除hdfs中文本文件中的新行字符?

在加载到配置单元之前,您必须编写一个hadoop(流式处理是一个选项)作业来清理数据

在加载到Hive之前,您必须编写一个hadoop(流式处理是一个选项)作业来清理数据

您是如何创建配置单元表的<代码>以“/”结尾的行格式分隔字段?您是如何创建配置单元表的<代码>以“/”结尾的行格式分隔字段?