Java 为什么';ServletContext#setRequestCharacterEncoding';不影响';HttpServletRequest#getReader';?
我们可以通过Java 为什么';ServletContext#setRequestCharacterEncoding';不影响';HttpServletRequest#getReader';?,java,servlet-4,Java,Servlet 4,我们可以通过ServletContext#setRequestCharacterEncoding(自Servlet4.0以来)设置默认字符编码以用于读取请求正文 我认为HttpServletRequest#getReader的字符编码可以使用ServletContext#setRequestCharacterEncoding(*)设置 但是HttpServletRequest#getReader返回的读取器似乎没有使用ServletContext#setRequestCharacterEncod
ServletContext#setRequestCharacterEncoding
(自Servlet4.0以来)设置默认字符编码以用于读取请求正文
我认为HttpServletRequest#getReader
的字符编码可以使用ServletContext#setRequestCharacterEncoding(*)
设置
但是HttpServletRequest#getReader
返回的读取器似乎没有使用ServletContext#setRequestCharacterEncoding
设置的编码来解码字符
我的问题是:
- 为什么
对ServletContext#setRequestCharacterEncoding
没有影响(但对HttpServletRequest#getReader
有影响)HttpServletRequest#getParameter
- 是否有任何规范描述此类
和ServletContext#setRequestCharacterEncoding
行为李>HttpServletRequest#getReader
ServletContext\setRequestCharacterEncoding
[环境]
- Tomcat9.0.19(我不更改任何默认配置)
- JDK11
- Windows8.1
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
</head>
<body>
<form action="/SimpleWarApp/app/simple" method="post">
<!-- The value is Japanese character '\u3042' -->
<input type="text" name="hello" value="あ"/>
<input type="submit" value="submit!"/>
</form>
<button type="button" id="the_button">post</button>
<script>
document.getElementById('the_button').addEventListener('click', function() {
var xhttp = new XMLHttpRequest();
xhttp.open('POST', '/SimpleWarApp/app/simple');
xhttp.setRequestHeader('Content-Type', 'text/plain');
<!-- The body content is Japanese character '\u3042' -->
xhttp.send('あ');
});
</script>
</body>
</html>
[SimpleServlet.java]
@WebServlet("/app/simple")
@SuppressWarnings("serial")
public class SimpleServlet extends HttpServlet {
@Override
protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
// req.setCharacterEncoding("UTF-8");
System.out.println("requestCharacterEncoding : " + req.getServletContext().getRequestCharacterEncoding());
System.out.println("req.getCharacterEncoding() : " + req.getCharacterEncoding());
String hello = req.getParameter("hello");
if (hello != null) {
System.out.println("hello : " + req.getParameter("hello"));
} else {
System.out.println("body : " + req.getReader().readLine());
}
}
}
我没有任何servlet过滤器。
以上三个都是此war应用程序的组件。
()
案例1:
当我提交带有参数“hello”的表单时,“hello”的值被成功解码如下
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
hello : あ
案例2:
当我单击“发布”并发送文本内容时,请求正文无法成功解码,如下所示。
(尽管我确认请求主体由UTF-8编码,如下所示:E3 81 82
)
案例3:
当我在servlet的“doPost”方法的第一行使用HttpServletRequest#setCharacterEncoding
设置编码时,请求正文成功解码
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : ???
案例4:
当我使用http.setRequestHeader('Content-Type','text/plain;charset=UTF-8')代码>javascript,请求正文已成功解码
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : ???
案例5:
当我不调用req.getParameter(“hello”)
时,无法成功解码请求正文
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : あ
requestCharacterEncoding : UTF-8
req.getCharacterEncoding() : UTF-8
body : ???
案例6:
当我不在InitServletContextListener.java
调用ServletContext#setRequestCharacterEncoding
时,不会设置字符编码
requestCharacterEncoding : null
req.getCharacterEncoding() : null
body : ???
[注]
- (*)我这样认为是因为:
- (1) HttpServletRequest#getReader的java文档说 “读取器根据正文上使用的字符编码翻译字符数据”
- (2) HttpServletRequest的java文档#getCharacterEncoding说 “返回此请求正文中使用的字符编码的名称”
- (3) HttpServletRequest的java文档#getCharacterEncoding也说 “以下指定请求字符编码的方法按优先级降序查阅:每个请求,每个web应用(使用ServletContext.setRequestCharacterEncoding,部署描述符)”
工作正常。当我使用ServletContext#setResponseCharacterEncoding
时,ServletContext#setResponseCharacterEncoding
返回的编写器通过它设置的字符编码对响应体进行编码HttpServletResponse#getWriter
getReader()
),由于您在Tomcat用户邮件列表上的报告,它将在9.0.21以后得到修复
好奇的是,如果您使用http.setRequestHeader('Content-Type','text/plain;charset=UTF-8');`javascript?你的发现很有趣。另外,如果在读取主体缓冲区之前不调用`req.getParameter(“hello”)`会发生什么情况?在servlet顶部是否有任何requestfilters来破坏request.characterencoding属性?如果不设置context.characterencoding,则有差异。我认为应该从请求中获取NULL。如果没有设置值,则getCharacterEncoding()将其设置为空。我已经测试了“http.setRequestHeader('Content-Type','text/plain;charset=UTF-8');`javascript(案例4)和servlet不调用
req.getParameter(“hello”)
(案例5)。我已经编辑了我的问题。我没有任何Servlet过滤器。以上三个都是我的war应用程序的组件。我已经测试了应用程序没有调用ServletContext#setRequestCharacterEncoding
(案例6)。我已经编辑了我的问题。可能是Tomcat bug。我认为最好不要使用context.setRequestCharacterEncoding
方法。检查请求。getCharacterEncoding()==null然后在每个servlet代码上设置UTF-8编码。