「java汉字编码的区别」字符和汉字编码的区别

admin 2023-01-19 17:03:06 1655

本篇文章给大家谈谈java汉字编码的区别，以及字符和汉字编码的区别对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。

本文目录一览：

1、java中编码与解码分别指什么？
2、java 中文乱码问题 utf-8和gbk的区别
3、java汉字编码与内存存储区别

java中编码与解码分别指什么？

java中编码：URLEncoder.encode(strUri,"utf-8");

java中解码码：URLDecoder.decode(strUri,"utf-8");

java编码和解码

流读取文件，具有转换编码功能的有：OutputStreamWriter和InputStreamReader，

构造器有如：

InputStreamReader(InputStream in, String charsetName)

创建使用指定字符集的 InputStreamReader。

OutputStreamWriter(OutputStream out, String charsetName)

创建使用指定字符集的 OutputStreamWriter。

处理字符串编码问题：

重新对获取的字符串进行编码：Byte[] bytes = str.getBytes(String encodeCharsetNam);

重新对bytes进行解码，创建新的字符串对象：str = new String(Byte[] bytes,String decodeCharsetName);

一般结合使用：str = new String(str.getBytes(String encodeCharsetName),String decodeCharsetName);

例如：resultName=new String(username.getBytes("ISO-8859-1"),"UTF-8");

还可以加入判断：

if(!Charset.forName("gbk").newEncoder().canEncode(str)){str = new Strin(str.getBytes("ISO-8859-1"),"UTF-8");}else{str = new String(str.getBytes("ISO-8859-1"),"gbk");}

处理请求参数传递编码问题：

java中编码：URLEncoder.encode(strUri,"utf-8");

java中解码码：URLDecoder.decode(strUri,"utf-8");

js中编码：encodeURIComponent(strUri);encodeURI(strUri);escape(str);

js中解码：decodeURIComponent(strUri);decodeURI(strUri);unescape(str);

补充概念：

URI组件：主机、端口、路径、查询参数、片段等。

URI组件分隔符：:/?#[]@,冒号用于分隔协议和主机，/用于分隔主机和路径，?用于分隔路径和查询参数，用于分隔多个查询参数等。

URI中的不安全字符或保留字符： ! * ‘ ( ) ; : @ = + $ , / ? # [ ] 他们具有特殊作用，例如上面的分隔作用。

URI允许出现的字符：只允许包含英文字母（a-zA-Z）、数字（0-9）、-_.~4个特殊字符以及所有保留字符，其他字符均需要经过编码之后才能出现在Url中，比如使用保留字符的原意，而不是特殊作用。

js向java/jsp的编码与解码：

js中编码：encodeURI(encodeURI(strUri));decodeURIComponent(decodeURIComponent(strUri));

java/jsp中解码： java.net.URLDecoder.decode(strUri,"UTF-8");

js中编码两次的问题：如果使用一次编码，在浏览器地址栏里，浏览器认为%是个转义字符，浏览器会把%与%之间的编码值，两位两位取出后进行解码。

然后再传递给处理页面，然后由处理页面进行再次解码，这样前面就缺少了一次编码过程，所以前面需要连续两次编码。

java 中文乱码问题 utf-8和gbk的区别

Java中UTF-8转GBK之所以不会出现中文乱码，是因为UTF-8编码为兼容性最大的字符集编码，它本身就支持中文字符。

Java代码转码范例：

String s = new String(ss.getBytes(),"GBK");

当你的内容本来就是正常的中文字符时，通过上面的语句转为GBK编码是不会有任何问题的，但如果你在转码之前的字符不是正确的中文字符，或者不是支持中文字符的字符集，那可能就会出现乱码问题。

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言（如英文，日文，韩文）。

在Java开发中，特别是web开发，乱码是一种很常见而且很头疼的问题，这常常是由于页面端、服务端、数据库等几处所使用的字符不一致所致，故开发中，保持编码一致，往往能减少由于乱码而带来的时间浪费，是一件非常重要的事情。

java汉字编码与内存存储区别

改为getBytes("Unicode");或getBytes("UTF-8);试试

getBytes(); 使用的应该是本机的编码（比如GBK）而直接获取使用的是Unicode编码

关于java汉字编码的区别和字符和汉字编码的区别的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

标签：java汉字编码的区别