libcurl第十三课 httpheader要求中文必须为iso8859-1编码解读-天翼云

libcurl第十三课 httpheader要求中文必须为iso8859-1编码解读

2024-06-24 07:23:24 阅读次数：42

备注：

不仅仅是URL存在中文需要进行编码，而且表单中存在中文的，也需要进行编码，还有编码前的中文必须是UTF-8编码，如果是GBK中文编码，还需要转为UTF-8编码

场景

对接HTTP服务器，对方要求将UTF-8编码的字符串浙FN358Y转换ISO8859-1编码

有时候,为了让中文字符适应某些特殊要求(如httpheader要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如:

String s_iso88591 = newString("中".getBytes("UTF-8"),"ISO8859-1"),这样得到的s_iso8859-1字符串实际是三个在ISO8859-1中的字符,在将这些字符传递到目的地后,目的地程序再通过相反的方式Strings_utf8 = newString(s_iso88591.getBytes("ISO8859-1"),"UTF-8")来得到正确的中文汉字"中"，这样就既保证了遵守协议规定、也支持中文。

1)iconv指令

-f指的是原始文件编码，-t是输出编码，-c 指的是从输出中忽略无效的字符， --verbose指的是打印进度信息 -o是输出文件

1.指令转码

[root@taishan-atlas home]# iconv --verbose -f utf-8 -t ISO_8859-1 input.txt -o output.txt

input.txt:

iconv: illegal input sequence at position 0

2.假如忽略无效字符，直接把前面的浙中文忽略了

[root@taishan-atlas home]# iconv -c --verbose -f utf-8 -t ISO_8859-1 input.txt -o output.txt

input.txt:

[root@taishan-atlas home]# cat output.txt

FN358Y[root@taishan-atlas home]#

3不用转换.GB2312就用ISO8859-1

4 Java编码异常

new String(byte[],decode)方法

而与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个"中"字,

这个new String(byte[],decode)实际是使用指定的编码decode来将byte[]解析成字符串.

String s_gbk = new String(b_gbk,"GBK");

String s_utf8 = new String(b_utf8,"UTF-8");

String s_iso88591 = new String(b_iso88591,"ISO8859-1");

通过输出s_gbk、s_utf8和s_iso88591,会发现s_gbk和s_utf8都是"中",而只有s_iso88591是一个不被识别的字符（可以理解为乱码）,为什么使用ISO8859-1编码再组合之后,无法还原"中"字？原因很简单,因为ISO8859-1编码的编码表根本就不包含汉字字符,当然也就无法通过"中".getBytes("ISO8859-1");来得到正确的"中"字在ISO8859-1中的编码值了,所以，再通过newString()来还原就更是无从谈起。

因此,通过String.getBytes(Stringdecode)方法来得到byte[]时,一定要确定decode的编码表中确实存在String表示的码值,这样得到的byte[]数组才能正确被还原。

解决方案

实际上iso8859-1编码就是针对中文进行URL编码，通过调用

char* pszEnCodeFilter = curl_easy_escape(NULL, strFilterContent.c_str(), strFilterContent.length());

curl_free(pszEnCodeFilter);

解决问题

注意：在百度搜索中文的时候，实际上也行了URL编码

延申：

实际URL包含特殊符号，也需要进行URL编码，例如#号

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

libcurl第十三课 httpheader要求中文必须为iso8859-1编码解读

libcurl第十三课 httpheader要求中文必须为iso8859-1编码解读

相关文章

security antMatchers(HttpMethod method, String... antPatterns)实现特定注解无需登录认证功能

S2-007 远程代码执行漏洞检测与利用

java保留2位小数点

java知识点总结（二）

Java 自定义提取字符串中的某一段字符

Java 不区分大小写比较字符串

Java各个类型与byte[]的转换

Java 一行代码判断String字符串是否为纯符号

Java学习路线-17：Java基础类库StringBuffer、AutoCloseable、Runtime、System

Java自动装箱与拆箱(AutoBoxing_UnBoxing)

作者介绍

最新文章

security antMatchers(HttpMethod method, String... antPatterns)实现特定注解无需登录认证功能

java保留2位小数点

java知识点总结（二）

String index out of range错误与解决方法

引用传递的实例分析

谈谈架构和微服务

热门文章

Map or switch

谈谈架构和微服务

libcurl第十四课: 获取返回报文的头部信息

引用传递的实例分析

灵魂拷问：java的String到底可不可变？

libcurl第十课 基于winssl的HTTPS交互

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

libcurl第六课 x-www-form-urlencoded使用

libcurl第十四课: 获取返回报文的头部信息

Hibernate查询方式汇总（一）

String、StringBuffer和StringBuilder类的区别以及StringBuffer的常用方法 StringBuffer的capacity容量扩容机制

class.getClassLoader().getResourceAsStream(file) class.getResourceAsStream(file)区别

String、toString、String.valueOf 三者对比

libcurl第十课基于winssl的HTTPS交互