Hadoop 字符引用“&#1“;是无效的XML字符

Hadoop 字符引用“&#1“;是无效的XML字符,hadoop,Hadoop,我使用值\001设置属性mapred.textoutputformat.separator。但当我运行MR作业时,它抛出异常: 字符引用“”是无效的XML字符 请帮帮我。我找到了解决办法。原因是当使用“\001”字符序列或其他Unicode字符时,在对象序列化过程中,它被转换为一些无效格式 因此,解决方案是使用Base64对字符进行编码,重写TextOutputFormat类的getRecordWriter方法,然后在那里对其进行解码 这会奏效的

我使用值
\001
设置属性
mapred.textoutputformat.separator
。但当我运行MR作业时,它抛出异常:

字符引用“”是无效的XML字符


请帮帮我。

我找到了解决办法。原因是当使用“\001”字符序列或其他Unicode字符时,在对象序列化过程中,它被转换为一些无效格式

因此,解决方案是使用Base64对字符进行编码,重写TextOutputFormat类的getRecordWriter方法,然后在那里对其进行解码

这会奏效的