Node.js中使用Buffer编码、解码二进制数据详解


Posted in Javascript onAugust 16, 2014

JavaScript很擅长处理字符串,但是因为它最初的设计是用来处理HTML文档,因此它并不太擅长处理二进制数据。JavaScript没有byte类型,没有结构化的类型(structured types),甚至没有字节数组,只有数字和字符串。(原文:JavaScript doesn't have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.)

因为Node基于JavaScript,它自然可以处理类似HTTP这样的文本协议,但是你也可以用它来跟数据库交互,处理图片或文件上传等,可以想象,如果仅仅用字符串来做这些事得有多困难。早些时候,Node通过将byte编码成文本字符来处理二进制数据,但这种方式后来被证明并不可行,既浪费资源,又缓慢,又不灵活,而且难以维护。

Node有一个二进制缓冲实现Buffer,这个伪类(pseudo-class)提供了一系列处理二进制数据的API,简化了那些需要处理二进制数据的任务。缓冲的长度由字节数据的长度决定,而且你可以随机的设置和获取缓冲内的字节数据。

注意:Buffer类有一个特殊的地方,缓冲内的字节数据所占用的内存不是分配在JavaScrp

It VM内存堆上的,也就是说这些对象不会被JavaScript的垃圾回收算法处理,取而代之的是一个不会被修改的永久内存地址,这也避免了因缓冲内容的内存复制所造成的CPU浪费。

创建缓冲

你可以用一个UTF-8字符串创建缓冲,像这样:

var buf = new Buffer(‘Hello World!');

也可以用指定编码的字符串创建缓冲:
var buf = new Buffer('8b76fde713ce', 'base64');

可接受的字符编码和标识如下:

1.ascii——ASCI,仅适用于ASCII字符集。
2.utf8——UTF-8,这种可变宽编码适用于Unicode字符集的任何字符,它已经成了Web世界的首选编码,也是Node的默认编码类型。
3.base64——Base64,这种编码基于64个可打印ASCII字符来表示二进制数据,Base64通常用于在字符文档内嵌入可以被转化成字符串的二进制数据,在需要时又可以完整无损的转换回原来的二进制格式。

如果没有数据来初始化缓冲,可以用指定的容量大小来创建一个空缓冲:

var buf = new Buffer(1024); // 创建一个1024字节的缓冲

获取和设置缓冲数据

创建或接收一个缓冲对象后,你可能要查看或者修改它的内容,可以通过[]操作符来访问缓冲的某个字节:

var buf = new Buffer('my buffer content');

// 访问缓冲内第10个字节

console.log(buf[10]); // -> 99

注意:当你(使用缓冲容量大小来)创建一个已初始化的缓冲时,一定要注意,缓冲的数据并没有被初始化成0,而是随机数据。

var buf = new Buffer(1024);
console.log(buf[100]); // -> 5 (某个随机值)

你可以这样修改缓冲里任何位置的数据:

buf[99] = 125; // 把第100个字节的值设置为125

注意:在某些情况下,一些缓冲操作并不会产生错误,比如:

1.缓冲内的字节最大值为255,如果某个字节被赋予大于256的数字,将会用256对其取模,然后将结果赋给这个字节。
2.如果将缓冲的某个字节赋值为256,它的实际值将会是0(译者注:其实跟第一条重复,256%256=0)
3.如果用浮点数给缓冲内某个字节赋值,比如100.7,实际值将会是浮点数的整数部分——100
4.如果你尝试给一个超出缓冲容量的位置赋值,赋值操作将会失败,缓冲不做任何修改。

你可以用length属性获取缓冲的长度:

var buf = new Buffer(100);
console.log(buf.length); // -> 100

还可以使用缓冲长度迭代缓冲的内容,来读取或设置每个字节:

var buf = new Buffer(100);
for(var i = 0; i < buf.length; i++) {
    buf[i] = i;
}

上面代码新建了一个包含100个字节的缓冲,并从0到99设置了缓冲内每个字节。

切分缓冲数据

一旦创建或者接收了一个缓冲,你可能需要提取缓冲数据的一部分,可以通过指定起始位置来切分现有的缓冲,从而创建另外一个较小的缓冲:

var buffer = new Buffer("this is the content of my buffer");
var smallerBuffer = buffer.slice(8, 19);
console.log(smallerBuffer.toString()); // -> "the content"

注意,当切分一个缓冲的时候并没有新的内存被分配或复制,新的缓冲使用父缓冲的内存,它只是父缓冲某段数据(由起始位置指定)的引用。这段话含有几个意思。

首先,如果你的程序修改了父缓冲的内容,这些修改也会影响相关的子缓冲,因为父缓冲和子缓冲是不同的JavaScript对象,因此很容易忽略这个问题,并导致一些潜在的bug。

其次,当你用这种方式从父缓冲创建一个较小的子缓冲时,父缓冲对象在操作结束后依然会被保留,并不会被垃圾回收,如果不注意的话,很容易会造成内存泄露。

注意:如果你担心因此产生内存泄露问题,你可以使用copy方法来替代slice操作,下面将会介绍copy。

复制缓冲数据

你可以像这样用copy将缓冲的一部分复制到另外一个缓冲:

var buffer1 = new Buffer("this is the content of my buffer");
var buffer2 = new Buffer(11);
var targetStart = 0;
var sourceStart = 8;
var sourceEnd = 19;
buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd);
console.log(buffer2.toString()); // -> "the content"

上面代码,复制源缓冲的第9到20个字节到目标缓冲的开始位置。

解码缓冲数据

缓冲数据可以这样转换成一个UTF-8字符串:

var str = buf.toString();

还可以通过指定编码类型来将缓冲数据解码成任何编码类型的数据。比如,你想把一个缓冲解码成base64字符串,可以这么做:

var b64Str = buf.toString("base64");

使用toString函数,你还可以把一个UTF-8字符串转码成base64字符串:
var utf8String = 'my string';
var buf = new Buffer(utf8String);
var base64String = buf.toString('base64')

小结

有时候,你不得不跟二进制数据打交道,但是原生JavaScript又没有明确的方式来做这件事,于是Node提供了Buffer类,封装了一些针对连续内存块的操作。你可以在两个缓冲之间切分或复制内存数据。

你也可以把一个缓冲转换成某种编码的字符串,或者反过来,把一个字符串转化成缓冲,来访问或处理每个bit。

Javascript 相关文章推荐
Ubuntu 11.10 安装Node.js的方法
Nov 30 Javascript
js实现飞入星星特效代码
Oct 17 Javascript
基于BootStrap Metronic开发框架经验小结【二】列表分页处理和插件JSTree的使用
May 12 Javascript
js字符串引用的两种方式(必看)
Sep 18 Javascript
javascript另类方法实现htmlencode()与htmldecode()函数实例分析
Nov 17 Javascript
layui中table表头样式修改方法
Aug 15 Javascript
解决layui checkbox 提交多个值的问题
Sep 02 Javascript
微信小程序实现一张或多张图片上传(云开发)
Sep 25 Javascript
js使用文档就绪函数动态改变页面内容示例【innerHTML、innerText】
Nov 07 Javascript
vue搜索页开发实例代码详解(热门搜索,历史搜索,淘宝接口演示)
Apr 11 Javascript
解决vue下载后台传过来的乱码流的问题
Dec 05 Vue.js
js闭包的9个使用场景
Dec 29 Javascript
Node.js中创建和管理外部进程详解
Aug 16 #Javascript
Node.js模块加载详解
Aug 16 #Javascript
JS遍历Json字符串中键值对先转成JSON对象再遍历
Aug 15 #Javascript
手机端网页点击链接触发自动拨打或保存电话的示例代码
Aug 15 #Javascript
Node.js中使用事件发射器模式实现事件绑定详解
Aug 15 #Javascript
Node.js中使用计时器定时执行函数详解
Aug 15 #Javascript
javascript中实现兼容JAVA的hashCode算法代码分享
Aug 11 #Javascript
You might like
php获得文件扩展名三法
2006/11/25 PHP
php FLEA中二叉树数组的遍历输出
2012/09/26 PHP
PHP中__autoload和Smarty冲突的简单解决方法
2016/04/08 PHP
CakePHP框架Session设置方法分析
2017/02/23 PHP
HR vs ForZe BO3 第一场 2.13
2021/03/10 DOTA
WordPress 插件——CoolCode使用方法与下载
2007/07/02 Javascript
JavaScript prototype属性使用说明
2010/05/13 Javascript
js对数字的格式化使用说明
2011/01/12 Javascript
jquery获取节点名称
2015/04/26 Javascript
js正则匹配出所有图片及图片地址src的方法
2015/06/08 Javascript
跟我学习javascript的闭包
2015/11/16 Javascript
AngularJs表单校验功能实例代码
2017/02/09 Javascript
JavaScript之Canvas_动力节点Java学院整理
2017/07/04 Javascript
详解在React中跨组件分发状态的三种方法
2018/08/09 Javascript
vue微信分享到朋友圈 vue微信发送给好友
2018/11/28 Javascript
微信小程序实现点击效果
2019/06/21 Javascript
基于Vue的侧边目录组件的实现
2020/02/05 Javascript
JS数组索引检测中的数据类型问题详解
2021/01/11 Javascript
[04:55]完美世界副总裁蔡玮:DOTA2的自由、公平与信任
2013/12/18 DOTA
[38:30]2014 DOTA2国际邀请赛中国区预选赛 LGD-GAMING VS CIS 第一场2
2014/05/24 DOTA
python列表操作实例
2015/01/14 Python
Python Property属性的2种用法
2015/06/21 Python
Python2.7下安装Scrapy框架步骤教程
2017/12/22 Python
使用python和Django完成博客数据库的迁移方法
2018/01/05 Python
使用python将请求的requests headers参数格式化方法
2019/01/02 Python
超简单的Python HTTP服务
2019/07/22 Python
Python操作excel的方法总结(xlrd、xlwt、openpyxl)
2019/09/02 Python
Python Selenium库的基本使用教程
2021/01/04 Python
结合CSS3的布局新特征谈谈常见布局方法
2016/01/22 HTML / CSS
HTML5实现分享到微信好友朋友圈QQ好友QQ空间微博二维码功能
2018/01/03 HTML / CSS
html5实现多图片预览上传及点击可拖拽控件
2018/03/15 HTML / CSS
Anya Hindmarch官网:奢侈设计师手袋及配饰
2018/11/15 全球购物
旺仔牛奶广告词
2014/03/20 职场文书
王老吉广告词
2014/03/20 职场文书
酒店管理求职信范文
2014/04/06 职场文书
2014年会计人员工作总结
2014/12/10 职场文书