Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/321.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/windows/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
java控制台输出的默认字符编码_Java_Windows_Utf 8_Character Encoding_Console - Fatal编程技术网

java控制台输出的默认字符编码

java控制台输出的默认字符编码,java,windows,utf-8,character-encoding,console,Java,Windows,Utf 8,Character Encoding,Console,Java如何确定用于System.out的编码 鉴于以下类别: import java.io.File; import java.io.PrintWriter; public class Foo { public static void main(String[] args) throws Exception { String s = "xxäñxx"; System.out.println(s); PrintWriter out

Java如何确定用于
System.out
的编码

鉴于以下类别:

import java.io.File;
import java.io.PrintWriter;

public class Foo
{
    public static void main(String[] args) throws Exception
    {
        String s = "xxäñxx";
        System.out.println(s);
        PrintWriter out = new PrintWriter(new File("test.txt"), "UTF-8");
        out.println(s);
        out.close();
    }
}
它保存为UTF-8,并在Windows系统上使用
javac-编码UTF-8 Foo.java
进行编译

之后,在git bash控制台上(使用UTF-8字符集),我执行以下操作:

这是怎么回事

显然,java会检查它是否连接到终端,并在这种情况下更改其编码。有没有办法强迫Java简单地输出纯UTF-8



我在cmd控制台上也尝试了同样的方法。重定向STDOUT在这方面似乎没有任何区别。如果没有file.encoding参数,它将输出ansi编码,并输出utf8编码。

我假设您的控制台仍在cmd.exe下运行。我怀疑您的主机是否真的需要UTF-8-我希望它真的是OEM DOS编码(例如…)

Java将在JVM初始化期间使用集合对字节进行编码

在我的电脑上复制:

java Foo
Java编码为windows-1252;控制台解码为IBM850。结果:Mojibake

java -Dfile.encoding=UTF-8 Foo
cat test.txt
Java编码为UTF-8;控制台解码为IBM850。结果:Mojibake

java -Dfile.encoding=UTF-8 Foo
cat test.txt
cat将文件解码为UTF-8;cat编码为IBM850;控制台解码为IBM850

java Foo | cat
Java编码为windows-1252;cat解码为windows-1252;cat编码为IBM850;控制台解码为IBM850

java -Dfile.encoding=UTF-8 Foo | cat
Java编码为UTF-8;cat解码为UTF-8;cat编码为IBM850;控制台解码为IBM850

java -Dfile.encoding=UTF-8 Foo | cat
cat的这种实现必须使用启发式来确定字符数据是否为UTF-8,然后将数据从UTF-8或ANSI(例如windows-1252)转码到控制台编码(例如IBM850)

这可以通过以下命令确认:

$ java HexDump utf8.txt
78 78 c3 a4 c3 b1 78 78

$ cat utf8.txt
xxäñxx

$ java HexDump ansi.txt
78 78 e4 f1 78 78

$ cat ansi.txt
xxäñxx
由于
e4 f1
不是有效的UTF-8序列,因此cat命令可以进行此确定

您可以通过以下方式更正Java输出:

  • 设置为系统ANSI值
  • 使用类型
  • 像对待猫一样使用一些
HexDump是一个普通的Java应用程序:

import java.io.*;
class HexDump {
  public static void main(String[] args) throws IOException {
    try (InputStream in = new FileInputStream(args[0])) {
      int r;
      while((r = in.read()) != -1) {
        System.out.format("%02x ", 0xFF & r);
      }
      System.out.println();
    }
  }
}

System.out
使用。有时这甚至是控制台使用的编码。但是为什么
javafoo
输出的东西与
javafoo | cat
不同呢默认编码应相同。您是否确保使用utf-8编码保存文件?依赖源文件编码通常是个坏主意。为了真正安全,请使用
“\u”
转义定义字符串。非常感谢!我确信
cat
只是简单地复制字节。显然,在向终端写入时,它确实试图“修复”编码。我也不知道git bash确实使用IBM850 cmd终端。这个答案真的很有帮助。