从java文件中读取西里尔字符和非西里尔字符
我有一个包含西里尔字母和非西里尔字母的文件。但是,当我读取文件时,不会检索西里尔字符,也不会检索非西里尔字符。这是我正在使用的代码从java文件中读取西里尔字符和非西里尔字符,java,string,utf-8,cyrillic,Java,String,Utf 8,Cyrillic,我有一个包含西里尔字母和非西里尔字母的文件。但是,当我读取文件时,不会检索西里尔字符,也不会检索非西里尔字符。这是我正在使用的代码 private static String dirToPRocess = "D:\\stopwords_freq_v2.txt"; BufferedReader br = null; try { br = new BufferedReader(new InputStreamReader(new FileInputStream(
private static String dirToPRocess = "D:\\stopwords_freq_v2.txt";
BufferedReader br = null;
try {
br = new BufferedReader(new InputStreamReader(new FileInputStream(
dirToPRocess), "UTF-8"));
String line = br.readLine();
while (line != null) {
System.out.println(line);
line = br.readLine();
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
try {
br.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
您正在使用eclipse吗
您可以尝试以下方法使其工作:
使用字符编码utf-8保存java文件
如果您想在控制台上打印西里尔文字,我认为eclipse的属性中可能有这样一个设置,但不是100%确定的——根据我的经验,默认情况下应该打印西里尔文字
顺便说一句,您的java代码看起来不错。是的,我正在使用Eclipse@vikifor您是否尝试进入文件属性并将字符编码设置为utf-8?您可以右键单击该文件以访问属性,然后很容易找到单击的属性,并且选中了选项Default(继承自container:UTF-8)(我没有选中此按钮)。我还在Windows>首选项>常规>工作区中进行了更改,将“文本文件编码”设置为“其他:UTF-8”,但仍然没有得到用西里尔语编写的值。也许我应该在Windows>首选项中更改后重新创建文件…@vikiforhmm这里有一个相关帖子:帖子对我没有帮助