Hadoop 作为分隔符配置单元的特殊字符

Hadoop 作为分隔符配置单元的特殊字符,hadoop,apache-spark,hive,hiveql,hadoop2,Hadoop,Apache Spark,Hive,Hiveql,Hadoop2,我有一个这样的输入文件。我必须在这个hdfs文件上创建配置单元外部表。我尝试使用\u00A1和\u001作为分隔符,但不起作用 请建议 1¡1407¡231819¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡I¡1¡0¡10¡Long NAME 1448607¡0¡0.00000000¡0.00000000¡1448607¡D¡D 8¡90688¡225895¡0.0050000¡0.00000000¡0.

我有一个这样的输入文件。我必须在这个hdfs文件上创建配置单元外部表。我尝试使用\u00A1和\u001作为分隔符,但不起作用

请建议

1¡1407¡231819¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡I¡1¡0¡10¡Long NAME 1448607¡0¡0.00000000¡0.00000000¡1448607¡D¡D

8¡90688¡225895¡0.0050000¡0.00000000¡0.00000000¡0.00000000¡383.02000000¡383.02000000¡T¡1¡0¡10¡SHORT NAME

在我的例子中,八进制或十六进制的值是多少@它是十六进制A1(\u00A1)。有了@DuduMarkovitz分享的链接,它可能会起作用。如果某些列显示为
null
,那么您需要将hdfs文件中的几行提取到文本文件中,用记事本++或其他工具打开,以找出精确的分隔符(在N++中,菜单栏中有一个编码选项,您可能需要对其进行处理)。在我的情况下,八进制或十六进制值是多少?-------@它是十六进制A1(\u00A1)。有了@DuduMarkovitz分享的链接,它可能会起作用。如果某些列显示为
null
,则需要将hdfs文件中的几行提取到文本文件中,用记事本++或其他工具打开,以找出精确的分隔符(在N++中,菜单栏中有一个编码选项,您可以随意使用)。