Java web应用中的常见字符编码问题的解决方法

开发 后端
在web应用中,通常浏览器会根据http header: Content-type的值来决定用什么encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 页面使用的就UTF-8编码. 但是考虑到离线的html(用户可能把页面html保存到本地), 打开离线的html的时候就要在meta指定编码,当然不指定也会有default值,那么不指定有时就可能出现乱码。

以下是 Java web应用的常见编码问题

1. html页面的编码

在web应用中,通常浏览器会根据http header: Content-type的值来决定用什么encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 页面使用的就UTF-8编码。但是考虑到离线的html(用户可能把页面html保存到本地), 打开离线的html的时候就要在meta指定编码,当然不指定也会有default值,那么不指定有时就可能出现乱码。

Meta标签

  1. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> 

 

2. Http Request的编码

通常浏览在发送一个请求到服务器的时候,不会设置字符编码,在服务器端为了统一编码,可以在filter 中使用request.setCharacterEncoding("UTF-8")来设置编码. 一般浏览器都是用默认的ISO-8859-1字符编码,要解决中文参数乱码的时候都必须这一步。

 

3. http response的编码

http response中可以设置输出到浏览器的数据使用的编码方法是response.setCharacterEncoding("UTF-8")和response.setContentType("text/html; charset=UTF-8"), 如果只是单纯的设置编码,***是用response.setCharacterEncoding("UTF-8"),因为response.setContentType("text/html; charset=UTF-8")是针对具体的MIME类型设置对应的字符编码。需要注意的是这里设置的编码对JSP页面不一定起作用,理由是JSP页面有自己设置字符编码的方式,而且优先级更高。

 

4. JSP页面的编码

有以下三种方式, 如果同时有***种和第二种的时候只有一种会生效(如果不同的话),

还有***种和第二种会覆盖第三种

***要注意的是在使用1)或2)声明编码类型时,如果页面中include了其他JSP, 对于<%@ include file="BB.jsp" %>和<jsp:include page="BB.jsp"/>的区别, 假设在AA.jsp中使用前一种方式includeBB.jsp,那么BB.jsp中就不能有重复的编码的声明,效果是AA.jsp和BB.jsp都使用AA.jsp中声明的编码方式进行编码。

如果是使用后一种include的方式的话,AA.jsp和BB.jsp中都可以有各自编码的声明。

1) <%@ page contentType="text/html;charset=UTF-8"%>

2) <%@ page pageEncoding ="charset=UTF-8"%>

3) 在web.xml中添加以下设置

  1. <jsp-config> 
  2.  
  3. <jsp-property-group> 
  4. <url-pattern>*.jsp</url-pattern> 
  5.  
  6. <page-encoding>UTF-8</page-encoding> 
  7. </jsp-property-group> 
  8.  
  9. </jsp-config> 

 

5. web.xml和weblogic.xml中的mime的设置

在web.xml中可以指定mime映射,同时也可以指定对应类型使用的字符编码 (这里的设置也可以使用3中所说的http response.setContentType和response.setCharacterEncoding来做到),比如:

  1. <mime-mapping> 
  2.  
  3. <extension>html</extension> 
  4.  
  5. <mime-type>text/html; charset=UTF-8</mime-type> 
  6.  
  7. </mime-mapping> 
  8.  

在weblogic.xml中可以设置默认的mime类型和字符编码

  1. <container-discriptor> 
  2.  
  3. <default-mime-type>text/html; charset=UTF-8</default-mime-type> 
  4.  
  5. </container-discriptor> 

还有

  1. <charset-params> 
  2.  
  3. <input-charset> 
  4.  
  5. <resource-path>/*</resource-path> 
  6.  
  7. <java-charset-name>UTF-8</java-charset-name> 
  8.  
  9. </input-charset> 
  10.  
  11. </charset-params> 

 

总的来说,一个应用中html, http request, http response 和jsp pages中***显示地指定相同的字符编码,最方便的就是都设为UTF-8,所有字符都不会出错。对于mime mapping的设置***是在web.xml中设置。weblogic中的关于字符编码的设置一般不用设置(如果你把前面所说的都设置正确以后)。

原文链接:http://blog.csdn.net/liuhebing/article/details/7322250

【编辑推荐】

  1. Java中String.format的用法
  2. 如何在Oracle中使用Java存储过程(详解)
  3. 邮件功能开发:JavaMail
  4. 关于读写锁算法的Java实现及思考
  5. 6个提高Java开发者效率的工具
责任编辑:林师授 来源: liuhebing的博客
相关推荐

2013-06-20 09:14:43

2021-03-26 11:38:29

云计算

2021-03-25 11:25:43

云计算云计算产业云应用

2013-04-16 09:46:44

2014-04-23 10:29:57

2011-05-06 17:25:58

硒鼓

2010-01-12 13:28:07

Fedora Core

2022-04-06 10:09:17

云服务云计算

2009-12-14 11:06:18

2009-11-30 10:49:18

2012-11-19 11:30:40

PowerShell常见问题解决方法

2009-06-12 11:06:56

Java heap s

2020-05-15 22:47:22

电脑开机运行

2010-03-25 10:06:57

CentOS配置

2010-12-27 11:00:53

Virtualbox

2012-08-15 14:01:18

2009-02-18 14:28:23

编码乱码JSP

2023-10-31 18:57:02

Java字符串

2009-09-10 09:35:25

Linq语句

2009-08-24 10:37:11

Silverlight
点赞
收藏

51CTO技术栈公众号