详解如何提升JSON.stringify()的性能


Posted in Javascript onJune 12, 2019

1. 熟悉的JSON.stringify()

在浏览器端或服务端,JSON.stringify()都是我们很常用的方法:

  • 将 JSON object 存储到 localStorage 中;
  • POST 请求中的 JSON body;
  • 处理响应体中的 JSON 形式的数据;
  • 甚至某些条件下,我们还会用它来实现一个简单的深拷贝;
  • ……

在一些性能敏感的场合下(例如服务端处理大量并发),或面对大量 stringify 的操作时,我们会希望它的性能更好,速度更快。这也催生了一些优化的 stringify 方案/库,下图是它们与原生方法的性能对比:

详解如何提升JSON.stringify()的性能

绿色部分时原生JSON.stringify(),可见性能相较这些库都要低很多。那么,在大幅的性能提升背后的技术原理是什么呢?

2. 比 stringify 更快的 stringify

由于 JavaScript 是动态性很强的语言,所以对于一个 Object 类型的变量,其包含的键名、键值、键值类型最终只能在运行时确定。因此,执行JSON.stringify()时会有很多工作要做。在一无所知的情况下,我们想要大幅优化显然无能为力。

那么如果我们知道这个 Object 中的键名、键值信息呢 —— 也就是知道它的结构信息,这会有帮助么?

看个例子:

下面这个 Object,

const obj = { 
 name: 'alienzhou', 
 status: 6, 
 working: true 
};

我们对它应用JSON.stringify(),得到结果为

JSON.stringify(obj); 
// {"name":"alienzhou","status":6,"working":true}

现在如果我们知道这个obj的结构是固定的:

  • 键名不变
  • 键值的类型一定

那么其实,我可以创建一个“定制化”的 stringify 方法

function myStringify(o) { 
 return ( 
  '{"name":"' 
  + o.name 
  + '","status":' 
  + o.status 
  + ',"isWorking":' 
  + o.working 
  + '}' 
 ); 
}

看看我们的myStringify方法的输出:

myStringify({ 
 name: 'alienzhou', 
 status: 6, 
 working: true 
}); 
// {"name":"alienzhou","status":6,"isWorking":true} 
myStringify({ 
 name: 'mengshou', 
 status: 3, 
 working: false 
}); 
// {"name":"mengshou","status":3,"isWorking":false}

可以得到正确的结果,但只用到了类型转换和字符串拼接,所以“定制化”方法可以让“stringify”更快。

总结来看,如何得到比 stringify 更快的 stringify 方法呢?

需要先确定对象的结构信息; 根据其结构信息,为该种结构的对象创建“定制化”的stringify方法,其内部实际是通过字符串拼接生成结果的; 最后,使用该“定制化”的方法来 stringify 对象即可。

这也是大多数 stringify 加速库的套路,转化为代码就是类似:

import faster from 'some_library_faster_stringify'; 
// 1. 通过相应规则,定义你的对象结构 
const theObjectScheme = { 
 // …… 
}; 
// 2. 根据结构,得到一个定制化的方法 
const stringify = faster(theObjectScheme); 
// 3. 调用方法,快速 stringify 
const target = { 
 // …… 
}; 
stringify(target);

3. 如何生成“定制化”的方法

根据上面的分析,核心功能在于,根据其结构信息,为该类对象创建“定制化”的stringify方法,其内部实际是简单的属性访问与字符串拼接。

为了了解具体的实现方式,下面我以两个实现上略有差异的开源库为例来简单介绍一下。

3.1. fast-json-stringify

详解如何提升JSON.stringify()的性能

下图是根据 fast-json-stringify 提供的 benchmark 结果,整理出来的性能对比。

详解如何提升JSON.stringify()的性能

可以看到,在大多数场景下具备2-5倍的性能提升。

3.1.1. scheme 的定义方式

fast-json-stringify 使用了 JSON Schema Validation 来定义(JSON)对象的数据格式。其 scheme 定义的结构本身也是 JSON 格式的,例如对象

{ 
 name: 'alienzhou', 
 status: 6, 
 working: true 
}

对应的 scheme 就是:

{ 
 title: 'Example Schema', 
 type: 'object', 
 properties: { 
  name: { 
   type: 'string' 
  }, 
  status: { 
   type: 'integer' 
  }, 
  working: { 
   type: 'boolean' 
  } 
 } 
}

其 scheme 定义规则丰富,具体使用可以参考 Ajv 这个 JSON 校验库。

3.1.2. stringify 方法的生成

fast-json-stringify 会根据刚才定义的 scheme,拼接生成出实际的函数代码字符串,然后使用 Function 构造函数在运行时动态生成对应的 stringify 函数。

在代码生成上,首先它会注入预先定义好的各类工具方法,这一部分不同的 scheme 都是一样的:

var code = ` 
 'use strict' 
 ` 
 code += ` 
 ${$asString.toString()} 
 ${$asStringNullable.toString()} 
 ${$asStringSmall.toString()} 
 ${$asNumber.toString()} 
 ${$asNumberNullable.toString()} 
 ${$asIntegerNullable.toString()} 
 ${$asNull.toString()} 
 ${$asBoolean.toString()} 
 ${$asBooleanNullable.toString()} 
 `

其次,就会根据 scheme 定义的具体内容生成 stringify 函数的具体代码。而生成的方式也比较简单:通过遍历 scheme。

遍历 scheme 时,根据定义的类型,在对应代码处插入相应的工具函数用于键值转换。例如上面例子中name这个属性:

var accessor = key.indexOf('[') === 0 ? sanitizeKey(key) : `['${sanitizeKey(key)}']` 
switch (type) { 
 case 'null': 
  code += ` 
   json += $asNull() 
  ` 
  break 
 case 'string': 
  code += nullable ? `json += obj${accessor} === null ? null : $asString(obj${accessor})` : `json += $asString(obj${accessor})` 
  break 
 case 'integer': 
  code += nullable ? `json += obj${accessor} === null ? null : $asInteger(obj${accessor})` : `json += $asInteger(obj${accessor})` 
  break 
 ……

上面代码中的code变量保存的就是最后生成的函数体的代码串。由于在 scheme 定义中,name为string类型,且不为空,所以会在code中添加如下一段代码字符串:

"json += $asString(obj['name'])"

由于还需要处理数组、及联对象等复杂情况,实际的代码省略了很多。

然后,生成的完整的code字符串大致如下:

function $asString(str) { 
 // …… 
} 
function $asStringNullable(str) { 
 // …… 
} 
function $asStringSmall(str) { 
 // …… 
} 
function $asNumber(i) { 
 // …… 
} 
function $asNumberNullable(i) { 
 // …… 
} 
/* 以上是一系列通用的键值转换方法 */ 
/* $main 就是 stringify 的主体函数 */ 
function $main(input) { 
 var obj = typeof input.toJSON === 'function' 
  ? input.toJSON() 
  : input 
 var json = '{' 
 var addComma = false 
 if (obj['name'] !== undefined) { 
  if (addComma) { 
   json += ',' 
  } 
  addComma = true 
  json += '"name":' 
  json += $asString(obj['name']) 
 } 
 // …… 其他属性(status、working)的拼接 
 json += '}' 
 return json 
} 
return $main

最后,将code字符串传入 Function 构造函数来创建相应的 stringify 函数。

// dependencies 主要用于处理包含 anyOf 与 if 语法的情况 
dependenciesName.push(code) 
return (Function.apply(null, dependenciesName).apply(null, dependencies))

3.2. slow-json-stringify

详解如何提升JSON.stringify()的性能

slow-json-stringify 虽然名字叫 "slow",但其实是一个 "fast" 的 stringify 库(命名很调皮)。

The slowest stringifier in the known universe. Just kidding, it's the fastest (:

它的实现比前面提到的 fast-json-stringify 更轻量级,思路也很巧妙。同时它在很多场景下效率会比 fast-json-stringify 更快。

详解如何提升JSON.stringify()的性能

详解如何提升JSON.stringify()的性能

3.2.1. scheme 的定义方式

slow-json-stringify 的 scheme 定义更自然与简单,主要就是将键值替换为类型描述。还是上面这个对象的例子,scheme 会变为

{ 
 name: 'string', 
 status: 'number', 
 working: 'boolean' 
}

确实非常直观。

3.2.2. stringify 方法的生成

不知道你注意到没有

// scheme 
{ 
 name: 'string', 
 status: 'number', 
 working: 'boolean' 
} 
// 目标对象 
{ 
 name: 'alienzhou', 
 status: 6, 
 working: true 
}

scheme 和原对象的结构是不是很像?

这种 scheme 的巧妙之处在于,这样定义之后,我们可以先把 scheme JSON.stringify一下,然后“扣去”所有类型值,最后等着我们的就是把实际的值直接填充到 scheme 对应的类型声明处。

具体如何操作呢?

首先,可以直接对 scheme 调用JSON.stringify()来生成基础模版,同时借用JSON.stringify()的第二个参数来作为遍历方法收集属性的访问路径:

let map = {}; 
const str = JSON.stringify(schema, (prop, value) => { 
 const isArray = Array.isArray(value); 
 if (typeof value !== 'object' || isArray) { 
  if (isArray) { 
   const current = value[0]; 
   arrais.set(prop, current); 
  } 
  _validator(value); 
  map[prop] = _deepPath(schema, prop); 
  props += `"${prop}"|`; 
 } 
 return value; 
});

此时,map 里收集所有属性的访问路径。同时生成的props可以拼接为匹配相应类型字符还的正则表达式,例如我们这个例子里的正则表达式为/name|status|working"(string|number|boolean|undef)"|\\[(.*?)\\]/。

然后,根据正则表达式来顺序匹配这些属性,替换掉属性类型的字符串,换成统一的占位字符串"__par__",并基于"__par__"拆分字符串:

const queue = []; 
const chunks = str 
 .replace(regex, (type) => { 
  switch (type) { 
  case '"string"': 
  case '"undefined"': 
   return '"__par__"'; 
  case '"number"': 
  case '"boolean"': 
  case '["array-simple"]': 
  case '[null]': 
   return '__par__'; 
  default: 
   const prop = type.match(/(?<=\").+?(?=\")/)[0]; 
   queue.push(prop); 
   return type; 
  } 
 }) 
 .split('__par__');

这样你就会得到chunks和props两个数组。chunks里包含了被分割的 JSON 字符串。以例子来说,两个数组分别如下

// chunks 
[ 
 '{"name":"', 
 '","status":"', 
 '","working":"', 
 '"}' 
] 
// props 
[ 
 'name', 
 'status', 
 'working' 
]

最后,由于 map 中保存了属性名与访问路径的映射,因此可以根据 prop 访问到对象中某个属性的值,循环遍历数组,将其与对应的 chunks 拼接即可。

从代码量和实现方式来看,这个方案会更轻便与巧妙,同时也不需要通过 Function、eval 等方式动态生成或执行函数。

4. 总结

虽然不同库的实现有差异,但从整体思路上来说,实现高性能 stringify 的方式都是一样的:

  • 开发者定义 Object 的 JSON scheme;
  • stringify 库根据 scheme 生成对应的模版方法,模版方法里会对属性与值进行字符串拼接(显然,属性访问与字符串拼接的效率要高多了);
  • 最后开发者调用返回的方法来 stringify Object 即可。

归根到底,它本质上是通过静态的结构信息将优化与分析前置了。

Tips

最后,还是想提一下

所有的 benchmark 只能作为一个参考,具体是否有性能提升、提升多少还是建议你在实际的业务中测试;

fast-json-stringify 中使用到了 Function 构造函数,因此建议不要将用户输入直接用作 scheme,以防一些安全问题。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Javascript 相关文章推荐
js事件(Event)知识整理
Oct 11 Javascript
javascript实现百度地图鼠标滑动事件显示、隐藏
Apr 02 Javascript
JavaScript正则表达式匹配 div  style标签
Mar 15 Javascript
js倒计时小实例(多次定时)
Dec 08 Javascript
Bootstrap实现渐变顶部固定自适应导航栏
Aug 27 Javascript
JS判断一个数是否是水仙花数
Jun 11 Javascript
Swiper实现轮播图效果
Jul 03 Javascript
[js高手之路]单例模式实现模态框的示例
Sep 01 Javascript
jQuery UI Draggable + Sortable 结合使用(实例讲解)
Sep 07 jQuery
vuejs router history 配置到iis的方法
Sep 20 Javascript
vue  elementUI 表单嵌套验证的实例代码
Nov 06 Javascript
Vue v-for中的 input 或 select的值发生改变时触发事件操作
Aug 31 Javascript
基于vue-cli搭建多模块且各模块独立打包的项目
Jun 12 #Javascript
浅谈webpack 四个核心概念之Entry
Jun 12 #Javascript
vue安装遇到的5个报错及解决方法
Jun 12 #Javascript
深入学习JavaScript 高阶函数
Jun 11 #Javascript
javascript防抖函数debounce详解
Jun 11 #Javascript
详解ng-alain动态表单SF表单项设置必填和正则校验
Jun 11 #Javascript
vue实现路由懒加载及组件懒加载的方式
Jun 11 #Javascript
You might like
比较简单的百度网盘文件直链PHP代码
2013/03/24 PHP
YII中assets的使用示例
2014/07/31 PHP
php中get_cfg_var()和ini_get()的用法及区别
2015/03/04 PHP
PHP判断浏览器、判断语言代码分享
2015/03/05 PHP
PHP常用技巧汇总
2016/03/04 PHP
php array_merge_recursive 数组合并
2016/10/26 PHP
PHP实现二维数组中的查找算法小结
2018/06/09 PHP
Laravel框架源码解析之入口文件原理分析
2020/05/14 PHP
云网广告中的代码,提示出错,大家找找
2006/11/21 Javascript
jquery text(),val(),html()方法区别总结
2013/11/04 Javascript
Google (Local) Search API的简单使用介绍
2013/11/28 Javascript
详解JavaScript的另类写法
2016/04/11 Javascript
JavaScript的变量声明提升问题浅析(Hoisting)
2016/11/30 Javascript
原生JS获取元素集合的子元素宽度实例
2016/12/14 Javascript
微信小程序 ES6Promise.all批量上传文件实现代码
2017/04/14 Javascript
Vue.js项目部署到服务器的详细步骤
2017/07/17 Javascript
javascript 作用于作用域链的详解
2017/09/27 Javascript
Vue组件间数据传递的方式(3种)
2020/07/13 Javascript
Django框架设置cookies与获取cookies操作详解
2019/05/27 Python
Python求两点之间的直线距离(2种实现方法)
2019/07/07 Python
解决django-xadmin列表页filter关联对象搜索问题
2019/11/15 Python
pytorch 实现在一个优化器中设置多个网络参数的例子
2020/02/20 Python
python虚拟环境模块venv使用及示例
2020/03/04 Python
Python如何使用paramiko模块连接linux
2020/03/18 Python
python中sklearn的pipeline模块实例详解
2020/05/21 Python
css3实现二维码扫描特效的示例
2020/10/29 HTML / CSS
澳大利亚拥有最佳跳伞降落点和最好服务的跳伞项目运营商:Skydive Australia
2018/03/05 全球购物
数字天堂软件测试面试题
2012/12/23 面试题
企业厂务公开实施方案
2014/03/26 职场文书
电气自动化求职信
2014/06/24 职场文书
民主生活会发言材料
2014/10/20 职场文书
应届毕业生求职信范文
2015/03/19 职场文书
读《方与圆》有感:交友方圆有度
2020/01/14 职场文书
pytorch 实现在测试的时候启用dropout
2021/05/27 Python
基于Redis结合SpringBoot的秒杀案例详解
2021/10/05 Redis
Python GUI编程之tkinter 关于 ttkbootstrap 的使用详解
2022/03/03 Python