HTML表单提交时URL编码和服务端解密乱码的排查流程

作者：袖梨 2026-06-19

Tomcat GET请求中文乱码的根本原因是浏览器UTF-8编码URL参数（如%E4%B8%AD%E6%96%87），而Tomcat默认用ISO-8859-1解码，三环节（浏览器编码、connector解码、Servlet解析）不统一所致；唯一有效解法是在server.xml的Connector中添加URIEncoding="UTF-8"并重启。

表单提交后中文变乱码，不是编码没设对，而是整个链路里至少有 3 个环节各自按不同规则解码 —— 浏览器 URL 编码、服务器 connector 解码、Servlet 参数解析，三者不统一就必然出错。

GET 请求参数在地址栏显示 %E4%B8%AD%E6%96%87，但服务端拿到的是 ???

这是典型的 Tomcat 默认用 ISO-8859-1 解 URL 的结果。浏览器（Chrome/Firefox）默认用 UTF-8 编码中文，拼进 URL 后变成 %E4%B8%AD%E6%96%87，但 Tomcat 8+ 的 <connector></connector> 默认仍用 ISO-8859-1 去 decode 这串字节，导致错误还原。

必须在 $CATALINA_HOME/conf/server.xml 中修改 <connector></connector> 标签，显式加 URIEncoding="UTF-8"（不是 encoding，也不是 useBodyEncodingForURI）
不要写 URIEncoding="utf-8" 或 URIEncoding="UTF8"，只认 UTF-8（带短横）
改完重启 Tomcat，否则无效；Spring Boot 内嵌 Tomcat 需通过 server.tomcat.uri-encoding=UTF-8 配置
如果页面本身是 GBK 编码（极少见），则设为 URIEncoding="GBK"，但前端 &ltmeta charset="GBK"&gt 和后端都要严格匹配

POST 提交中文正常，但 GET 就乱码，为什么 `request.setCharacterEncoding("UTF-8")` 不起作用？

request.setCharacterEncoding() 只影响 POST 请求体（application/x-www-form-urlencoded 或 multipart/form-data）的解码，对 URL 查询字符串（即 GET 参数）完全无效。URL 参数由 Tomcat connector 层提前解码，到 Servlet 时已经“定型”了。

request.setCharacterEncoding("UTF-8") 必须在调用任何 getParameter() 前执行，且仅对 POST 生效
对 GET，唯一可控点是 server.xml 的 URIEncoding，或手动转码：new String(request.getParameter("name").getBytes("ISO-8859-1"), "UTF-8")（不推荐，治标不治本）
Spring MVC 的 CharacterEncodingFilter 默认也不处理 GET 参数，它只 wrap request body

`&ltform accept-charset="UTF-8"&gt` 有用吗？

基本没用。现代浏览器（Chrome/Firefox）忽略 accept-charset，仍按页面 &ltmeta charset&gt 编码提交；IE 虽支持但已淘汰。真正起作用的是页面本身的编码声明和服务器解码配置。

立即学习“前端免费学习笔记（深入）”；

accept-charset 值必须写成 UTF-8（大小写敏感），utf8 或 UTF8 无效
如果页面是 &ltmeta charset="UTF-8"&gt，表单无论是否写 accept-charset，都会用 UTF-8 编码值
若页面 meta 是 GBK，又硬写 accept-charset="UTF-8"，反而可能引发前后端不一致
真正要检查的是：HTML 文件保存编码是否真为 UTF-8（无 BOM）、HTTP 响应头 Content-Type: text/html; charset=utf-8 是否存在且匹配

AJAX fetch() 提交中文，后端收不到或乱码

fetch 默认用 UTF-8 编码请求体，但若后端接口返回 Content-Type: text/plain; charset=GBK，而前端用 response.text() 直接读取，就会按 UTF-8 解 GBK 字节流，必然乱码。

GET 请求：确保 URL 参数已用 encodeURIComponent() 编码，如 name=${encodeURIComponent("张三")}
POST 请求：若 Content-Type 是 application/json，JSON 本身是 UTF-8，无需额外处理；若是 application/x-www-form-urlencoded，需手动 URLSearchParams 构造并确保值已 encode
读响应时，优先用 response.text() + 显式指定解码：new TextDecoder('utf-8').decode(await response.arrayBuffer())，避免依赖响应头
后端返回 JSON 时，务必设响应头 Content-Type: application/json; charset=utf-8，否则某些老客户端可能误判

最易被忽略的一点：HTML 文件保存编码和 &ltmeta charset&gt 必须物理一致。VS Code 显示 “UTF-8”，但文件实际存为 “UTF-8 with BOM”，BOM 会卡在 &ltmeta 前面，导致浏览器无法识别 charset 声明 —— 此时哪怕所有配置都对，页面也会退回到 ISO-8859-1 解码。