Java Castor封送处理::无效的XML字符

Java Castor封送处理::无效的XML字符,java,xml,marshalling,castor,Java,Xml,Marshalling,Castor,我正在使用castorAPI将对象转换为XML 我得到以下异常 原因:org.xml.sax.SAXException:字符“”是无效的xml字符 我知道正确的方法是纠正源代码,但是有很多这样的无效字符 在另一个论坛中,有人建议在封送java对象内容之前对其进行编码,然后对输出进行解码(Base64)。这种方法看起来相当麻烦,不适合解决方案 我需要一种在封送处理过程中跳过这些字符的方法,生成的XML应该按原样包含这些字符。/** /** * This method ensures t

我正在使用castorAPI将对象转换为XML

我得到以下异常

原因:org.xml.sax.SAXException:字符“”是无效的xml字符

我知道正确的方法是纠正源代码,但是有很多这样的无效字符


在另一个论坛中,有人建议在封送java对象内容之前对其进行编码,然后对输出进行解码(
Base64
)。这种方法看起来相当麻烦,不适合解决方案

我需要一种在封送处理过程中跳过这些字符的方法,生成的XML应该按原样包含这些字符。

/**
 /**
     * This method ensures that the output String has only
     * valid XML unicode characters as specified by the
     * XML 1.0 standard. For reference, please see
     * <a href="http://www.w3.org/TR/2000/REC-xml-20001006#NT-Char">the
     * standard</a>. This method will return an empty
     * String if the input is null or empty.
     *
     * @param in The String whose non-valid characters we want to remove.
     * @return The in String, stripped of non-valid characters.
     */
    public String stripNonValidXMLCharacters(String in) {
        StringBuffer out = new StringBuffer(); // Used to hold the output.
        char current; // Used to reference the current character.

        if (in == null || ("".equals(in))) return ""; // vacancy test.
        for (int i = 0; i < in.length(); i++) {
            current = in.charAt(i); // NOTE: No IndexOutOfBoundsException caught here; it should not happen.
            if ((current == 0x9) ||
                (current == 0xA) ||
                (current == 0xD) ||
                ((current >= 0x20) && (current <= 0xD7FF)) ||
                ((current >= 0xE000) && (current <= 0xFFFD)) ||
                ((current >= 0x10000) && (current <= 0x10FFFF)))
                out.append(current);
        }
        return out.toString();
    }  
*此方法确保输出字符串仅具有 *由指定的有效XML unicode字符 *XML1.0标准。有关参考资料,请参阅 * . 此方法将返回一个空值 *字符串,如果输入为null或空。 * *@param,我们要删除其无效字符的字符串。 *@返回字符串,去掉无效字符。 */ 公共字符串stripNonValidXMLCharacters(字符串输入){ StringBuffer out=new StringBuffer();//用于保存输出。 char current;//用于引用当前字符。 if(in==null | |(“”.equals(in)))返回“”;//空缺测试。 对于(int i=0;i((当前>=0x20)&&&(当前=0xE000)&&&(当前=0x10000)&&(当前如果希望生成的XML包含此类

角色本身

,那么XML1.1规范可能会有所帮助。 Castor可以配置为通过自定义
org.exolab.Castor.XML.XMLSerializerFactory
org.exolab.Castor.XML.Serializer
实现封送到XML 1.1中:

package com.foo.castor;
......

import org.exolab.castor.xml.BaseXercesOutputFormat;
import org.exolab.castor.xml.Serializer;
import org.exolab.castor.xml.XMLSerializerFactory;
import org.xml.sax.DocumentHandler;

import com.sun.org.apache.xml.internal.serialize.OutputFormat;
import com.sun.org.apache.xml.internal.serialize.XML11Serializer;

@SuppressWarnings("deprecation")
public class CastorXml11SerializerFactory implements XMLSerializerFactory {

    private static class CastorXml11OutputFormat extends BaseXercesOutputFormat{

        public CastorXml11OutputFormat(){
            super._outputFormat = new OutputFormat();
        }
    }

    private static class CastorXml11Serializer implements Serializer {

        private XML11Serializer serializer = new XML11Serializer();

        @Override
        public void setOutputCharStream(Writer out) {
            serializer.setOutputCharStream(out);
        }

        @Override
        public DocumentHandler asDocumentHandler() throws IOException {
            return serializer.asDocumentHandler();
        }

        @Override
        public void setOutputFormat(org.exolab.castor.xml.OutputFormat format) {
            serializer.setOutputFormat((OutputFormat)format.getFormat());
        }

        @Override
        public void setOutputByteStream(OutputStream output) {
            serializer.setOutputByteStream(output);
        }

    }

    @Override
    public Serializer getSerializer() {
        return new CastorXml11Serializer();
    }

    @Override
    public org.exolab.castor.xml.OutputFormat getOutputFormat() {
        return new CastorXml11OutputFormat();
    }

}
castor.properties
文件中全局

org.exolab.castor.xml.serializer.factory=com.foo.castor.CastorXml11SerializerFactory
org.exolab.castor.xml.version=1.1
或者通过特定的
castorshaller
方法设置这两个属性


但是,请注意,而且。

在进一步挖掘之后,我发现无效字符只是一个退格(ASCII码=8)。将退格字符插入字符串的方式很奇怪。有什么建议吗?在编组java对象内容之前对其进行编码,并在解组后进行解码。这似乎是解决此问题的唯一方法。marshal.setEncoding(“base64”);使用了base64编码和解码。我认为使用base64不合适,因为这不是二进制数据。下面的答案确实有帮助。谢谢。