Java SAXParser实现正在跳过实体
我有一个org.xml.sax.helpers.DefaultHandler的实现,它工作得很好,除非出现以下情况:Java SAXParser实现正在跳过实体,java,saxparser,Java,Saxparser,我有一个org.xml.sax.helpers.DefaultHandler的实现,它工作得很好,除非出现以下情况: <NAME>Jiří Bárta</NAME> 但是到达方法的char数组只有'Ji',跳过字符串的其余部分。 我有另一种方法将这些实体转换为UTF-8,但我从未获得它们,因此我无法转换任何内容。请注意,解析器可能无法在一次调用中传递所有字符数据。为了安全起见,您必须从可能的几个character()调
<NAME>Jiří Bárta</NAME>
但是到达方法的char数组只有'Ji',跳过字符串的其余部分。
我有另一种方法将这些实体转换为UTF-8,但我从未获得它们,因此我无法转换任何内容。请注意,解析器可能无法在一次调用中传递所有字符数据。为了安全起见,您必须从可能的几个character()调用中构建字符串,并用startElement()/endElement()括起来
作为旁注,为什么要将“实体”转换为UTF-8?它们已转换为UTF-16字符。您描述的功能是正确的,您的理解是错误的 尝试在处理程序类中实现
resolveEntity
。有趣的是,resolveEntity
的目的是解析实体。字符串“Jiř;í;”以两个字符“Ji”开头,然后包含两个实体。“ř;”是一个实体,“í;”是另一个实体
另一个选择是不实现
resolveEntity
,而是实现skippedEntity
。我已经解决了读取内容、取消字符缩放然后解析XML的问题。但这是解析器应该为您做的工作。或
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if (currentElement) {
currentValue = new String(ch, start, length);
currentElement = false;
}
}