Java 使用VTD-XML的带符号和的XML文件的ParserException
我正在尝试使用VTD-xml解析来自JMDict项目的JMDict_e.xml文件。但是,我遇到了一个解析错误 出现的唯一错误消息是:Java 使用VTD-XML的带符号和的XML文件的ParserException,java,xml,parsing,vtd-xml,kanji,Java,Xml,Parsing,Vtd Xml,Kanji,我正在尝试使用VTD-xml解析来自JMDict项目的JMDict_e.xml文件。但是,我遇到了一个解析错误 出现的唯一错误消息是: ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char xml的简短摘录如下所示: <entry> <ent_seq>1279770</ent_seq> <k_ele>
ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char
xml的简短摘录如下所示:
<entry>
<ent_seq>1279770</ent_seq>
<k_ele>
<keb>構成要素</keb>
</k_ele>
<r_ele>
<reb>こうせいようそ</reb>
</r_ele>
<sense>
<pos>&n;</pos>
<pos>&adj-no;</pos>
<field>∁</field>
<gloss>components</gloss>
<gloss>elements</gloss>
<gloss>parts</gloss>
</sense>
</entry>
我相信在pos字段中,非法字符很可能是符号。有没有办法让vtd xml不将这些符号视为特殊字符?或者有不同的方法解决这个问题吗?VTD-XML只识别那些内置的字符实体。在我看来,大多数实体都是无效的。您可能需要先解决这些问题,然后再将其提供给解析器。XML不允许使用符号AND;如果您用&;替换;,那会有帮助的。我不熟悉vtd-xml。谢谢!我浏览了文件并删除了符号,然后vtd xml就能够解析它了。