nginx'的编码格式是什么;谁的访问日志?

nginx'的编码格式是什么;谁的访问日志?,nginx,Nginx,Nginx的access.log的编码是什么?我正试图遍历该文件,但当脚本看到对服务器的请求中包含中文/泰文字符时,脚本“UTF-8中的字节序列无效”。HTTP协议请求主要是ASCII码,数据字段允许为任何八位字节。看 Nginx的错误和访问日志将反映这一点 我在一个小型北美网站上处理45万条记录的经验表明,除了一条记录外,所有记录都被解码成ASCII码,没有错误。该记录包含4个连续字节(b'\xb8E\x8c\xde'),它们是无效的UTF-8,但是有效的big5hkscs(Python的繁体

Nginx的access.log的编码是什么?我正试图遍历该文件,但当脚本看到对服务器的请求中包含中文/泰文字符时,脚本“UTF-8中的字节序列无效”。

HTTP协议请求主要是ASCII码,数据字段允许为任何八位字节。看

Nginx的错误和访问日志将反映这一点

我在一个小型北美网站上处理45万条记录的经验表明,除了一条记录外,所有记录都被解码成ASCII码,没有错误。该记录包含4个连续字节(b'\xb8E\x8c\xde'),它们是无效的UTF-8,但是有效的big5hkscs(Python的繁体中文编解码器),产生了两个字形

请参阅以获取针对非ASCII位的暴力攻击的编解码器名称列表

将二进制日志记录解码为ASCII,并用“?”替换错误,这足以满足我的需要