最近在写一个小工具,使用jquery的serialize数据后调用getJson,结果返回的中文乱码。

用了半天的时间来尝试解决乱码问题,依然没有效果。后来偶然发现(如下图),当serialize的中文为“哈哈”时,返回的json数据确是三个字符,这是什么问题呢?


可以在很短的时间内看到,浏览器url中的“哈哈”最初是一个url编码,浏览器自动将其转换为中文“哈哈”,于是怀疑serialize的编码后传递到后端,后端将其解析成了三个字符,其实是没有乱码的,只是这三个字符本身就是乱码。

通过google,找到了解决方法:对serialize后的数据进行decodeURIComponent:

var params = jQuery("#formId").serialize(); 
 params = decodeURIComponent(params,true);


还有两种方法:

1.将jquery.js文件中的encodeURIComponent替换为encodeURI

2.将所有jsp、xml的字符集都设置为UTF-8 


为什么要这样做呢?

serialize默认使用的是encodeURIComponent进行编码,即utf-8编码,中文“哈哈”被编码为“%E5%93%88%E5%93%88”,即一个“哈”被编码为三个字节。

浏览器识别出“%E5%93%88%E5%93%88”,将自动将其转码为gbk的中文“哈哈”。

但是服务器端使用的是gbk编码,一个中文被编码为两个字节,即“哈哈”被解析成了三个字符。


Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐