解析包含字符引用的xml

解析包含字符引用的xml,xml,sax,Xml,Sax,im试图解析的XML在CDATA中包含一个控制字符0x2。我尝试将其替换为字符引用,从而使CDATA看起来像: CDATA section----charcter reference----CDATA section 现在,如果我尝试解析它,我会收到一条错误消息,上面说: org.xml.sax.SAXParseException:prolog中不允许包含内容 原始xml看起来像: <?xml version="1.1" encoding="UTF-16"?><CELL>

im试图解析的XML在CDATA中包含一个控制字符0x2。我尝试将其替换为字符引用,从而使CDATA看起来像:

CDATA section----charcter reference----CDATA section
现在,如果我尝试解析它,我会收到一条错误消息,上面说: org.xml.sax.SAXParseException:prolog中不允许包含内容

原始xml看起来像:

<?xml version="1.1" encoding="UTF-16"?><CELL><![CDATA[ABCD&#2;EFGH]]></CELL>

我将其修改为:

<?xml version="1.1" encoding="UTF-16"?><CELL><![CDATA[ABCD]]>&#2;<![CDATA[EFGH]]></CELL>
和#2;

在CDATA部分中未解析实体定义,这就是原始示例不起作用的原因。在我看来,修改后的示例不起作用似乎是SAX解析器的错误。可能SAX解析器不允许在CDATA部分中解析以实体定义开头的XML prolog之前使用不可见的字节顺序标记(BOM),这就是原始示例不起作用的原因。在我看来,修改后的示例不起作用似乎是SAX解析器的错误。也许SAX解析器不允许在XML序言之前使用不可见的字节顺序标记(BOM),该序言以Post开头,通过编辑您的问题,您将询问实际的XML。执行此操作时,请选择XML并按文本输入区域上方的1010按钮。通过编辑您的问题发布您正在询问的实际XML。执行此操作时,选择XML并按文本输入区域上方的1010按钮。