Linux 配置单元表字段由'¬';配置单元不接受此字符

Linux 配置单元表字段由'¬';配置单元不接受此字符,linux,hadoop,hive,Linux,Hadoop,Hive,当我尝试在create table中使用数据时,我得到的错误是无效字符。我尝试使用它的unicode版本“\U00AC”,但在第一个字段中没有使用所有记录。在unix中,此字符“,”显示为è½。 有没有人能告诉我,在以章节结尾的领域应该使用什么 CREATE TABLE IF NOT EXISTS test ( CONTACT_RECORD_ID string, ACCOUNT string, CUST string, NUMBER string, NUMBER1

当我尝试在create table中使用数据时,我得到的错误是无效字符。我尝试使用它的unicode版本“\U00AC”,但在第一个字段中没有使用所有记录。在unix中,此字符“,”显示为è½。 有没有人能告诉我,在以章节结尾的领域应该使用什么

CREATE TABLE IF NOT EXISTS test
(
CONTACT_RECORD_ID    string,
ACCOUNT    string,
CUST    string,
NUMBER    string,
NUMBER1    string,
NUMBER2    string,
NUMBER3    string,
NUMBER4    string,
NUMBER5    string,
NUMBER6    string,
NUMBER7    string,
LIST    string
)
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '¬';

你能试试这个DDL吗

CREATE TABLE IF NOT EXISTS test
(
CONTACT_RECORD_ID    string,
ACCOUNT    string,
CUST    string,
NUMBER    string,
NUMBER1    string,
NUMBER2    string,
NUMBER3    string,
NUMBER4    string,
NUMBER5    string,
NUMBER6    string,
NUMBER7    string,
LIST    string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES ('empty.string.null'='true','field.delim'='\0AC','serialization.format'='\0AC','serialization.null.format'='')
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat';

如果您有csv格式的数据,您可以像中一样使用此工具轻松地将数据导出到Hadoop中。

在任何显示的
ïêê½
中,您需要更改文本编码设置。在Linux上,
文件xyz.txt
命令显示什么?即,哪种编码?Hadoop默认使用UTF-8。是的,将其编码为ISO-8859文本。此伙伴的任何解决方案:)ty尝试了它,但没有解决问题。第一列输出中的所有数据如下:1ë½00000000000000 10792ë½0000000000000 549223ë½HFBlHgUUmGrCdë½HaNlzg0tEë½HFNë½Hë½Xë½93aëHFNBd2htë½QB3aë½HFNBughjkL4ï½NULL NULL NULL NULL NULL可以验证NULL文件是否包含NULL NULL NULL空值吗作为分隔符。请使用“cat | grep&”