Java 要接受的DTD元素类型'<';

Java 要接受的DTD元素类型'<';,java,xml,dtd,Java,Xml,Dtd,我的xml文件可能如下所示: <unclassified> WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM< </unclassified> [Fatal Error] arm1sub.sgml:14:46: The content of elements must consist of well-formed character data or markup. org.xml.sax.SAXParseExceptio

我的xml文件可能如下所示:

<unclassified>
  WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<
</unclassified>
[Fatal Error] arm1sub.sgml:14:46: The content of elements must consist of well-formed character data or markup.
org.xml.sax.SAXParseException; systemId: file:/home/sfalk/workspace/project/target/classes/meter_corpus/PA/annotated/courts/12.07.99/arm/arm1sub.sgml; lineNumber: 14; columnNumber: 46; The content of elements must consist of well-formed character data or markup.
    at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257)
    at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:348)
    at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:205)

我怎样才能做到这一点?我希望这在某种程度上是可行的,而无需操作我的.xml文件。

DTD中没有任何可以更改的内容来解决此问题。必须更改“xml”文档本身。(从技术上讲,您的文档甚至不是真正的XML。)

DTD(和XSD)的权限是验证,但XML有效的先决条件是格式良好。(事实上,XML文档的一个先决条件是格式良好。)


请仔细阅读,了解差异的详细解释。对于您的特定问题,替换
DTD中没有可以更改的内容来解决此问题。必须更改“XML”文档本身。(从技术上讲,您的文档甚至不是真正的XML。)

DTD(和XSD)的权限是验证,但XML有效的先决条件是格式良好。(事实上,XML文档的一个先决条件是格式良好。)


请仔细阅读,了解差异的详细解释。对于您的特定问题,replace
如果要使用包含无效字符的值作为xml解析器,可以使用CDATA:



木材公司因青少年失去手臂被罚款3万英镑

如果要使用包含无效字符的值作为xml解析器,可以使用CDATA:



木材公司因青少年失去手臂被罚款3万英镑

这不是dtd问题—这只是格式不正确的XML。它将在没有任何dtd参与的情况下被打破。您应该担心是什么创建了XML文件。另请参见,这不是dtd问题——这根本不是格式良好的XML。它将在没有任何dtd参与的情况下被打破。您应该担心是什么创建了XML文件
[Fatal Error] arm1sub.sgml:14:46: The content of elements must consist of well-formed character data or markup.
org.xml.sax.SAXParseException; systemId: file:/home/sfalk/workspace/project/target/classes/meter_corpus/PA/annotated/courts/12.07.99/arm/arm1sub.sgml; lineNumber: 14; columnNumber: 46; The content of elements must consist of well-formed character data or markup.
    at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257)
    at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:348)
    at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:205)
<unclassified>
  <![CDATA[WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM<]]>
</unclassified>
<unclassified>
  WOOD FIRM FINED #30,000 OVER TEEN'S LOST ARM
</unclassified>