Java 使用HTML代码生成XML的简单方法?

Java 使用HTML代码生成XML的简单方法?,java,html,xml,Java,Html,Xml,我有一个XML文件sample.XML,其中包含以下内容: <Tokens> <Token>Hello&nbsp;World</Token> </Tokens> 由于我没有XML文档的模式,我想知道是否有一种方法可以让它在解析时完全忽略HTML特殊字符?您所要求的是不可能的,因为要解析ask XML,实体必须在某个地方有一个定义。要将其解析为XML以外的内容,您需要编写自己的解析器,或者使用一个宽容的解析器。XML不是标签汤。XML

我有一个XML文件sample.XML,其中包含以下内容:

<Tokens>
   <Token>Hello&nbsp;World</Token>
</Tokens>

由于我没有XML文档的模式,我想知道是否有一种方法可以让它在解析时完全忽略HTML特殊字符?

您所要求的是不可能的,因为要解析ask XML,实体必须在某个地方有一个定义。要将其解析为XML以外的内容,您需要编写自己的解析器,或者使用一个宽容的解析器。XML不是标签汤。

XML不支持
,尽管XHTML支持。检查


解决方案是在构建XML时使用Unicode不间断空格字符
和#160
;相反在某些情况下,纯空格也起作用(
&32
)。在解析XML之前,您可以尝试用“”空格替换

我同意Reedwald。但作为一种解决方法,您可以将文件读取为字符串,并在解析文档之前用空格替换

在XML中,
是一个实体引用,但未定义,除非提供定义。您不能让XML解析器忽略它们,但可以定义它们,例如,以

<!DOCTYPE Tokens [<!ENTITY nbsp "&#xa0;">]>

但是,如果要生成XML文件,这可能没有用处。您也可以生成一个包含真实字符“U+00A0不间断空格”或字符引用
 
或其十进制等价物
 

参考问题

<!DOCTYPE Tokens [<!ENTITY nbsp "&#xa0;">]>