Character encoding 如何使用Awk读取不同编码的文件?

Character encoding 如何使用Awk读取不同编码的文件?,character-encoding,awk,Character Encoding,Awk,如何在Awk中正确读取非UTF8编码的文件 我有一个希伯来语/Windows-1255编码的文件。 一个简单的{print$0}awk打印如下内容�. 如何使其正确阅读?awk本身不支持处理不同的编码。它将遵循环境中指定的区域设置,但最好的办法是在将输入转换为正确的编码后再将其交给awk -f是要转换的格式,-t是目标格式,-c跳过任何提前终止iconv操作的无效字符。当然,帮助会提供更多细节 iconv -c -f cp1255 -t utf8 somefile | awk ... 这很可能

如何在Awk中正确读取非UTF8编码的文件

我有一个希伯来语/Windows-1255编码的文件。 一个简单的{print$0}awk打印如下内容�.
如何使其正确阅读?

awk本身不支持处理不同的编码。它将遵循环境中指定的区域设置,但最好的办法是在将输入转换为正确的编码后再将其交给awk

-f是要转换的格式,-t是目标格式,-c跳过任何提前终止iconv操作的无效字符。当然,帮助会提供更多细节

iconv -c -f cp1255 -t utf8 somefile | awk ...

这很可能和你的终端和awk有同样多的关系。