Java XPath生成乱码输出,而不是Unicode字符
我正在分析此XML文件:Java XPath生成乱码输出,而不是Unicode字符,java,jvm,Java,Jvm,我正在分析此XML文件: <?xml version="1.0" encoding="UTF-8"?> <tests> <test category="Русский"/> <test category="ελληνικά"/> <test category="中文"/> <test category="English"/> </tests> 主要课程为: import jav
<?xml version="1.0" encoding="UTF-8"?>
<tests>
<test category="Русский"/>
<test category="ελληνικά"/>
<test category="中文"/>
<test category="English"/>
</tests>
主要课程为:
import java.io.File;
import java.io.FileInputStream;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathFactory;
import org.w3c.dom.NodeList;
import org.xml.sax.InputSource;
public class TestUnicode {
public static void main(String[] args) throws Exception {
XPath xpath = XPathFactory.newInstance().newXPath();
XPathExpression lolwhy = xpath.compile("//test");
final InputSource inputSource =
new InputSource(
new FileInputStream(
new File("sample.xml")));
NodeList parent = (NodeList) lolwhy.evaluate(
inputSource,
XPathConstants.NODESET);
System.out.println(parent.getLength());
for (int i = 0; i < parent.getLength(); i++) {
System.out.println(parent.item(i).getAttributes().
getNamedItem("category").getNodeValue());
}
}
}
输出为:
4
???????
????????
??
English
我做错了什么
编辑:好的,这个问题与相关,解决方案是:可能是解析正常,但输出错误 如果使用了不包含这些字符的字体,或者将值输出到HTML,但指定了错误的编码,则可能会出现这种情况
字体问题是最可能的问题。System.out.println是罪魁祸首。 看看这是否有帮助
Java控制台不理解发送给它的文本的编码。尝试将输出写入文本文件并读取。谢谢,但PrintStream解决方案仅打印:4Ðñƒ�Ñ�在Netbeans中,英语似乎是某种控制台输出问题,但有趣的是——无论我使用何种字体,它似乎都会打印垃圾。