Nodejs进阶之服务端字符编解码和乱码处理


Posted in NodeJs onSeptember 04, 2017

写在前面

在web服务端开发中,字符的编解码几乎每天都要打交道。编解码一旦处理不当,就会出现令人头疼的乱码问题。

不少从事node服务端开发的同学,由于对字符编码码相关知识了解不足,遇到问题时,经常会一筹莫展,花大量的时间在排查、解决问题。

文本先对字符编解码的基础知识进行简单介绍,然后举例说明如何在node中进行编解码,最后是服务端的代码案例。本文相关代码示例可在这里找到。

关于字符编解码

在网络通信的过程中,传输的都是二进制的比特位,不管发送的内容是文本还是图片,采用的语言是中文还是英文。

举个例子,客户端向服务端发送"你好"。

客户端 --- 你好 ---> 服务端

这中间包含了两个关键步骤,分别对应的是编码、解码。

1.客户端:将"你好"这个字符串,编码成计算机网络需要的二进制比特位。

2.服务端:将接收到的二进制比特位,解码成"你好"这个字符串。

总结一下:

1.编码:将需要传送的数据,转成对应的二进制比特位。

2.解码:将二进制比特位,转成原始的数据。

上面有些重要的技术细节没有提到,答案在下一小节。

  • 客户端怎么知道"你好"这个字符对应的比特位是多少?
  • 服务端收到二进制比特位之后,怎么知道对应的字符串是什么?

关于字符集和字符编码

上面提到字符、二进制的转换问题。既然两者可以互相转换,也就是说存在明确的转换规则,可以实现字符<->二进制的相互转换。

这里提到的转换规则,其实就是我们经常听到的字符集&字符编码。

字符集是一系列字符(文字、标点符号等)的集合。字符集有很多,常见的有ASCII、Unicode、GBK等。不同字符集主要的区别在于包含字符个数的不同。

了解了字符集的概念后,接下来介绍下字符编码。

字符集告诉我们支持哪些字符,但具体字符怎么编码,是由字符编码决定的。比如Unicode字符集,支持的字符编码有UTF8(常用)、UTF16、UTF32。

概括一下:

  • 字符集:字符的集合,不同字符集包含的字符数不同。
  • 字符编码:字符集中字符的实际编码方式。
  • 一个字符集可能有多种字符编码方式。

可以把字符编码看成一个映射表,客户端、服务端就是根据这个映射表,来实现字符跟二进制的编解码转换。

举个例子,"你"这个字符,在UTF8编码中,占据三个字节0xe4 0xbd 0xa0,而在GBK编码中,占据两个字节0xc4 0xe3。

字符编解码例子

上面已经提到了字符编解码所需的基础知识。下面我们看一个简单的例子,这里借助了icon-lite这个库来帮助我们实现编解码的操作。

可以看到,在字符编码时,我们采用了gbk。在解码时,如果同样采用gbk,可以得到原始的字符。而当我们解码时采用utf8时,则出现了乱码。

var iconv = require('iconv-lite');

var oriText = '你';

var encodedBuff = iconv.encode(oriText, 'gbk');
console.log(encodedBuff);
// <Buffer c4 e3>

var decodedText = iconv.decode(encodedBuff, 'gbk');
console.log(decodedText);
// 你

var wrongText = iconv.decode(encodedBuff, 'utf8');
console.log(wrongText);
// ��

实际例子:服务端编解码

通常我们需要处理编解码的场景有文件读写、网络请求处理。这里距网络请求的例子,介绍如何在服务端进行编解码。

假设我们运行着如下http服务,监听来自客户端的请求。客户端传输数据时采用了gbk编码,而服务端默认采用的是utf8编码。

如果此时采用默认的utf8对请求进行解码,就会出现乱码,因此需要特殊处理。

服务端代码如下(为简化代码,这里跳过了请求方法、请求编码的判断)

var http = require('http');
var iconv = require('iconv-lite');

// 假设客户端采用post方法,编码为gbk
var server = http.createServer(function (req, res) {
  var chunks = [];
  
  req.on('data', function (chunk) {
    chunks.push(chunk)
  });

  req.on('end', function () {
    chunks = Buffer.concat(chunks);

    // 对二进制进行解码
    var body = iconv.decode(chunks, 'gbk');
    console.log(body);

    res.end('HELLO FROM SERVER');
  });

});

server.listen(3000);

对应的客户端代码如下:

var http = require('http');
var iconv = require('iconv-lite');

var charset = 'gbk';

// 对字符"你"进行编码
var reqBuff = iconv.encode('你', charset);

var options = {
  hostname: '127.0.0.1',
  port: '3000',
  path: '/',
  method: 'POST',
  headers: {
    'Content-Type': 'text/plain',
    'Content-Encoding': 'identity',
    'Charset': charset // 设置请求字符集编码
  }
};

var client = http.request(options, function(res) {
  res.pipe(process.stdout);
});

client.end(reqBuff);

相关链接

Nodejs学习笔记:https://github.com/chyingp/nodejs-learning-guide

iconv-lite:https://github.com/ashtuchkin/iconv-lite

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

NodeJs 相关文章推荐
Nodejs关于gzip/deflate压缩详解
Mar 04 NodeJs
学习 NodeJS 第八天:Socket 通讯实例
Dec 21 NodeJs
详解nodejs 文本操作模块-fs模块(五)
Dec 23 NodeJs
Nodejs 发送Post请求功能(发短信验证码例子)
Feb 09 NodeJs
基于Nodejs利用socket.io实现多人聊天室
Feb 22 NodeJs
NodeJS仿WebApi路由示例
Feb 28 NodeJs
初识NodeJS服务端开发入门(Express+MySQL)
Apr 07 NodeJs
nodejs中解决异步嵌套循环和循环嵌套异步的问题
Jul 12 NodeJs
nodejs对express中next函数的一些理解
Sep 08 NodeJs
NodeJS实现不可逆加密与密码密文保存的方法
Mar 16 NodeJs
用Electron写个带界面的nodejs爬虫的实现方法
Jan 29 NodeJs
nodejs的安装使用与npm的介绍
Sep 11 NodeJs
Windows下使用Nodejs运行js的方法
Sep 02 #NodeJs
用nodejs实现json和jsonp服务的方法
Aug 25 #NodeJs
NodeJS收发GET和POST请求的示例代码
Aug 25 #NodeJs
Nodejs 和Session 原理及实战技巧小结
Aug 25 #NodeJs
Nodejs 复制文件/文件夹的方法
Aug 24 #NodeJs
使用Nodejs连接mongodb数据库的实现代码
Aug 21 #NodeJs
nodejs动态创建二维码的方法
Aug 12 #NodeJs
You might like
Discuz Uchome ajaxpost小技巧
2011/01/04 PHP
php使用cookie实现记住登录状态
2015/04/27 PHP
善用事件代理,警惕闭包的性能陷阱。
2011/01/20 Javascript
Javascript获取窗口(容器)的大小及位置参数列举及简要说明
2012/12/09 Javascript
Jquery实现搜索框提示功能示例代码
2013/08/13 Javascript
div+css+js实现无缝滚动类似marquee无缝滚动兼容firefox
2013/08/29 Javascript
原生JavaScript实现连连看游戏(附源码)
2013/11/05 Javascript
javascript arguments使用示例
2014/12/16 Javascript
浅谈Unicode与JavaScript的发展史
2015/01/19 Javascript
JavaScript基础重点(必看)
2016/07/09 Javascript
AngularJS 模块化详解及实例代码
2016/09/14 Javascript
详解nodejs的express如何自动生成项目框架
2017/07/12 NodeJs
vue+webpack 打包文件 404 页面空白的解决方法
2018/02/28 Javascript
微信小程序实现收藏与取消收藏切换图片功能
2018/08/03 Javascript
深入理解使用Vue实现Context-Menu的思考与总结
2019/03/09 Javascript
Vue父子之间值传递的实例教程
2020/07/02 Javascript
python正则表达式中的括号匹配问题
2014/12/14 Python
使用C语言扩展Python程序的简单入门指引
2015/04/14 Python
python爬虫 批量下载zabbix文档代码实例
2019/08/21 Python
python打印n位数“水仙花数”(实例代码)
2019/12/25 Python
tensorflow2.0与tensorflow1.0的性能区别介绍
2020/02/07 Python
详解Python中@staticmethod和@classmethod区别及使用示例代码
2020/12/14 Python
几款主流好用的富文本编辑器(所见即所得常用编辑器)介绍
2021/03/17 Javascript
中国海淘族值得信赖的海淘返利网站:55海淘
2017/01/16 全球购物
神路信息Java面试题目
2013/03/31 面试题
跟单文员的岗位职责
2013/11/14 职场文书
学校元旦晚会方案
2014/02/19 职场文书
公司活动方案范文
2014/03/06 职场文书
基层党员对照检查材料
2014/09/24 职场文书
2014光棍节单身联谊活动策划书
2014/10/10 职场文书
个人存款证明书
2014/10/18 职场文书
2014年计生工作总结
2014/11/21 职场文书
大学生学年个人总结
2015/02/15 职场文书
三八节活动主持词
2015/07/04 职场文书
导游词之安徽九华山
2019/09/18 职场文书
MySQL表锁、行锁、排它锁及共享锁的使用详解
2022/04/02 MySQL