Tomcat GET请求中文乱码的根本原因是浏览器UTF-8编码URL参数(如%E4%B8%AD%E6%96%87),而Tomcat默认用ISO-8859-1解码,三环节(浏览器编码、connector解码、Servlet解析)不统一所致;唯一有效解法是在server.xml的Connector中添加URIEncoding="UTF-8"并重启。
表单提交后中文变乱码,不是编码没设对,而是整个链路里至少有 3 个环节各自按不同规则解码 —— 浏览器 URL 编码、服务器 connector 解码、Servlet 参数解析,三者不统一就必然出错。
这是典型的 Tomcat 默认用 ISO-8859-1 解 URL 的结果。浏览器(Chrome/Firefox)默认用 UTF-8 编码中文,拼进 URL 后变成 %E4%B8%AD%E6%96%87,但 Tomcat 8+ 的 <connector></connector> 默认仍用 ISO-8859-1 去 decode 这串字节,导致错误还原。
$CATALINA_HOME/conf/server.xml 中修改 <connector></connector> 标签,显式加 URIEncoding="UTF-8"(不是 encoding,也不是 useBodyEncodingForURI)URIEncoding="utf-8" 或 URIEncoding="UTF8",只认 UTF-8(带短横)server.tomcat.uri-encoding=UTF-8 配置URIEncoding="GBK",但前端 <meta charset="GBK"> 和后端都要严格匹配request.setCharacterEncoding("UTF-8") 不起作用?request.setCharacterEncoding() 只影响 POST 请求体(application/x-www-form-urlencoded 或 multipart/form-data)的解码,对 URL 查询字符串(即 GET 参数)完全无效。URL 参数由 Tomcat connector 层提前解码,到 Servlet 时已经“定型”了。
request.setCharacterEncoding("UTF-8") 必须在调用任何 getParameter() 前执行,且仅对 POST 生效server.xml 的 URIEncoding,或手动转码:new String(request.getParameter("name").getBytes("ISO-8859-1"), "UTF-8")(不推荐,治标不治本)CharacterEncodingFilter 默认也不处理 GET 参数,它只 wrap request body<form accept-charset="UTF-8"> 有用吗?基本没用。现代浏览器(Chrome/Firefox)忽略 accept-charset,仍按页面 <meta charset> 编码提交;IE 虽支持但已淘汰。真正起作用的是页面本身的编码声明和服务器解码配置。
立即学习“前端免费学习笔记(深入)”;
accept-charset 值必须写成 UTF-8(大小写敏感),utf8 或 UTF8 无效<meta charset="UTF-8">,表单无论是否写 accept-charset,都会用 UTF-8 编码值GBK,又硬写 accept-charset="UTF-8",反而可能引发前后端不一致Content-Type: text/html; charset=utf-8 是否存在且匹配fetch 默认用 UTF-8 编码请求体,但若后端接口返回 Content-Type: text/plain; charset=GBK,而前端用 response.text() 直接读取,就会按 UTF-8 解 GBK 字节流,必然乱码。
encodeURIComponent() 编码,如 name=${encodeURIComponent("张三")}
Content-Type 是 application/json,JSON 本身是 UTF-8,无需额外处理;若是 application/x-www-form-urlencoded,需手动 URLSearchParams 构造并确保值已 encoderesponse.text() + 显式指定解码:new TextDecoder('utf-8').decode(await response.arrayBuffer()),避免依赖响应头Content-Type: application/json; charset=utf-8,否则某些老客户端可能误判最易被忽略的一点:HTML 文件保存编码和 <meta charset> 必须物理一致。VS Code 显示 “UTF-8”,但文件实际存为 “UTF-8 with BOM”,BOM 会卡在 <meta 前面,导致浏览器无法识别 charset 声明 —— 此时哪怕所有配置都对,页面也会退回到 ISO-8859-1 解码。