Hadoop 作为分隔符配置单元的特殊字符_Hadoop_Apache Spark_Hive_Hiveql_Hadoop2

Hadoop 作为分隔符配置单元的特殊字符

hadoop apache-spark hive

Hadoop 作为分隔符配置单元的特殊字符,hadoop,apache-spark,hive,hiveql,hadoop2,Hadoop,Apache Spark,Hive,Hiveql,Hadoop2,我有一个这样的输入文件。我必须在这个hdfs文件上创建配置单元外部表。我尝试使用\u00A1和\u001作为分隔符，但不起作用请建议 1¡1407¡231819¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡I¡1¡0¡10¡Long NAME 1448607¡0¡0.00000000¡0.00000000¡1448607¡D¡D 8¡90688¡225895¡0.0050000¡0.00000000¡0.

我有一个这样的输入文件。我必须在这个hdfs文件上创建配置单元外部表。我尝试使用\u00A1和\u001作为分隔符，但不起作用

请建议

1¡1407¡231819¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡0.00000000¡I¡1¡0¡10¡Long NAME 1448607¡0¡0.00000000¡0.00000000¡1448607¡D¡D

8¡90688¡225895¡0.0050000¡0.00000000¡0.00000000¡0.00000000¡383.02000000¡383.02000000¡T¡1¡0¡10¡SHORT NAME

在我的例子中，八进制或十六进制的值是多少@它是十六进制A1（\u00A1）。有了@DuduMarkovitz分享的链接，它可能会起作用。如果某些列显示为

null

，那么您需要将hdfs文件中的几行提取到文本文件中，用记事本++或其他工具打开，以找出精确的分隔符（在N++中，菜单栏中有一个编码选项，您可能需要对其进行处理）。在我的情况下，八进制或十六进制值是多少？-------@它是十六进制A1（\u00A1）。有了@DuduMarkovitz分享的链接，它可能会起作用。如果某些列显示为

null

，则需要将hdfs文件中的几行提取到文本文件中，用记事本++或其他工具打开，以找出精确的分隔符（在N++中，菜单栏中有一个编码选项，您可以随意使用）。