Linux 配置单元表字段由'¬'；配置单元不接受此字符_Linux_Hadoop_Hive

Linux 配置单元表字段由'¬'；配置单元不接受此字符

linux hadoop hive

Linux 配置单元表字段由'¬'；配置单元不接受此字符,linux,hadoop,hive,Linux,Hadoop,Hive,当我尝试在create table中使用数据时，我得到的错误是无效字符。我尝试使用它的unicode版本“\U00AC”，但在第一个字段中没有使用所有记录。在unix中，此字符“，”显示为è½。有没有人能告诉我，在以章节结尾的领域应该使用什么 CREATE TABLE IF NOT EXISTS test ( CONTACT_RECORD_ID string, ACCOUNT string, CUST string, NUMBER string, NUMBER1

当我尝试在create table中使用数据时，我得到的错误是无效字符。我尝试使用它的unicode版本“\U00AC”，但在第一个字段中没有使用所有记录。在unix中，此字符“，”显示为è½。有没有人能告诉我，在以章节结尾的领域应该使用什么

CREATE TABLE IF NOT EXISTS test
(
CONTACT_RECORD_ID    string,
ACCOUNT    string,
CUST    string,
NUMBER    string,
NUMBER1    string,
NUMBER2    string,
NUMBER3    string,
NUMBER4    string,
NUMBER5    string,
NUMBER6    string,
NUMBER7    string,
LIST    string
)
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '¬';

你能试试这个DDL吗

CREATE TABLE IF NOT EXISTS test
(
CONTACT_RECORD_ID    string,
ACCOUNT    string,
CUST    string,
NUMBER    string,
NUMBER1    string,
NUMBER2    string,
NUMBER3    string,
NUMBER4    string,
NUMBER5    string,
NUMBER6    string,
NUMBER7    string,
LIST    string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES ('empty.string.null'='true','field.delim'='\0AC','serialization.format'='\0AC','serialization.null.format'='')
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat';

如果您有csv格式的数据，您可以像中一样使用此工具轻松地将数据导出到Hadoop中。

在任何显示的

ïêê½

中，您需要更改文本编码设置。在Linux上，

文件xyz.txt

命令显示什么？即，哪种编码？Hadoop默认使用UTF-8。是的，将其编码为ISO-8859文本。此伙伴的任何解决方案：）ty尝试了它，但没有解决问题。第一列输出中的所有数据如下：1ë½00000000000000 10792ë½0000000000000 549223ë½HFBlHgUUmGrCdë½HaNlzg0tEë½HFNë½Hë½Xë½93aëHFNBd2htë½QB3aë½HFNBughjkL4ï½NULL NULL NULL NULL NULL可以验证NULL文件是否包含NULL NULL NULL空值吗作为分隔符。请使用“cat | grep&”