如何基于JS截获动态代码


Posted in Javascript onDecember 25, 2019

这篇文章主要介绍了JS注入eval, Function系统函数并截获动态代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

正文

现在很多网站都上了各种前端反爬手段,无论手段如何,最重要的是要把包含反爬手段的前端javascript代码加密隐藏起来,然后在运行时实时解密动态执行。

动态执行js代码无非两种方法,即eval和Function。那么,不管网站加密代码写的多牛,我们只要将这两个方法hook住,即可获取到解密后的可执行js代码。

注意,有些网站会检测eval和Function这两个方法是否原生,因此需要一些小花招来忽悠过去。

挂钩代码

首先是eval的挂钩代码:

(function() {
  if (window.__cr_eval) return
  window.__cr_eval = window.eval
  var myeval = function (src) {
    console.log("================ eval begin: length=" + src.length + ",caller=" + (myeval.caller && myeval.caller.name) + " ===============")
    console.log(src);
    console.log("================ eval end ================")
    return window.__cr_eval(src)
  }
  var _myeval = myeval.bind(null) // 注意:这句和下一句就是小花招本招了!
  _myeval.toString = window.__cr_eval.toString
  Object.defineProperty(window, 'eval', { value: _myeval })
  console.log(">>>>>>>>>>>>>> eval injected: " + document.location + " <<<<<<<<<<<<<<<<<<<")
})();

这段代码执行后,之后所有的eval操作都会在控制台打印输出将要执行的js源码。

同理可以写出Function的挂钩代码:

(function() {
  if (window.__cr_fun) return
  window.__cr_fun = window.Function
  var myfun = function () {
    var args = Array.prototype.slice.call(arguments, 0, -1).join(","), src = arguments[arguments.length - 1]
    console.log("================ Function begin: args=" + args + ", length=" + src.length + ",caller=" + (myfun.caller && myfun.caller.name) + " ===============")
    console.log(src);
    console.log("================ Function end ================")
    return window.__cr_fun.apply(this, arguments)
  }
  myfun.toString = function() { return window.__cr_fun + "" } // 小花招
  Object.defineProperty(window, 'Function', { value: myfun })
  console.log(">>>>>>>>>>>>>> Function injected: " + document.location + " <<<<<<<<<<<<<<<<<<<")
})();

注意:和eval不同,Function是个有变长参数的构造方法,需要处理this

另外,有些网站还会用类似的机制加密页面内容,然后通过document.write输出动态解密的内容,因此同样可以挂钩document.write,挂钩方法类似eval,这里就不重复了。

注入方式

另外,还有个问题需要关注,就是挂钩代码的注入方法。

最简单的就是F12调出控制台,直接执行上面的代码,但这样只能hook住执行之后的eval调用,如果希望从页面刚加载时就注入,那么可以用以下几种方式:

  • 油猴注入,油猴可以监听文档加载的几种不同状态,并在特定时刻执行js代码。我没有太多研究,具体请参见油猴手册
  • 代理注入,修改应答数据,在<head>标签内的第一个位置插入<script>节点,确保在其它js加载执行前注入;Fiddler, anyproxy等都可以编写外部规则,具体请参见附录部分
  • 使用chrome-devtools-protocol, 通过Page.addScriptToEvaluateOnNewDocument注入外部js代码
  • 附录

不少人没用过代理规则,这里写一下Fiddler和anyproxy的规则编写方法:

1. 如何添加Fiddler代理规则

Fiddler菜单里Rules > Customize Rules 打开脚本编辑器

在脚本编辑器里找OnBeforeResponse方法,方法内添加下面C#代码:

if (oSession.oResponse.headers.ExistsAndContains("Content-Type", "html")){
  oSession.utilDecodeResponse(); // Remove any compression or chunking
  var b = System.Text.Encoding.UTF8.GetString(oSession.responseBodyBytes);
  var r = /<head[^>]*>/i;
  var js = "..."; // 要注入的js源码,见正文
  b = b.replace(r, "$0<script>" + js + "</script>");
  oSession.utilSetResponseBody(b); // Set the response body back
}

这样就会在所有html文档头部自动添加js代码了

2. 如何添加anyproxy代理规则

编辑一个rule.js保存在anyproxy根目录下,内容如下:

function injectEval() {
  if (window.__cr_eval) return
  ... // 见正文,此处略
  console.log(">>>>>>>>>>>>>> eval injected: " + document.location + " <<<<<<<<<<<<<<<<<<<")
}
module.exports = {
 summary: 'a rule to hook all eval',
 *beforeSendResponse(requestDetail, {response}) {
  if (response.header["Content-Type"].indexOf("text/html") >= 0) {
   response.body = (response.body + "").replace(/<head[^>]*>/i, `$&<script>(${injectEval})();</script>`)
   return {response}
  }
 },
};

带规则启动anyproxy

anyproxy -r rule.js

可以看到,使用基于js的工具链有其天然优势,即注入代码可以以源码而不是字符串形式和规则代码共存,这样可以利用到IDE的语法检查、自动完成等机制,能够大大提高生产力。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Javascript 相关文章推荐
用tip解决Ext列宽度不够的问题
Dec 13 Javascript
避免 showModalDialog 弹出新窗体的原因分析
May 31 Javascript
js URL参数的拼接方法比较
Feb 15 Javascript
javascript重写alert方法的实例代码
Mar 29 Javascript
Textarea根据内容自适应高度
Oct 28 Javascript
JS基于面向对象实现的拖拽库实例
Sep 24 Javascript
关于JavaScript中事件绑定的方法总结
Oct 26 Javascript
JS实现AES加密并与PHP互通的方法分析
Apr 19 Javascript
jquery easyui如何实现格式化列
Jul 30 jQuery
Java设计中的Builder模式的介绍
Mar 22 Javascript
vue如何将v-for中的表格导出来
May 07 Javascript
node.js中TCP Socket多进程间的消息推送示例详解
Jul 10 Javascript
通过微信公众平台获取公众号文章的方法示例
Dec 25 #Javascript
vue远程加载sfc组件思路详解
Dec 25 #Javascript
node实现mock-plugin中间件的方法
Dec 25 #Javascript
微信小程序停止其他视频播放当前视频的实例代码
Dec 25 #Javascript
vue分页插件的使用方法
Dec 25 #Javascript
继承行为在 ES5 与 ES6 中的区别详解
Dec 24 #Javascript
在JavaScript中实现链式调用的实现
Dec 24 #Javascript
You might like
php curl基本操作详解
2013/07/23 PHP
php mysqli查询语句返回值类型实例分析
2016/06/29 PHP
Laravel 类和接口注入相关的代码
2019/10/15 PHP
类似框架的js代码
2006/11/09 Javascript
基于jquery完美拖拽,可返回拖动轨迹
2012/03/29 Javascript
阻止子元素继承父元素事件具体思路及实现
2013/05/02 Javascript
浅析document.ready和window.onload的区别讲解
2013/12/18 Javascript
最简单的JavaScript验证整数、小数、实数、有效位小数正则表达式
2015/04/17 Javascript
Jquery实现的简单轮播效果【附实例】
2016/04/19 Javascript
js改变透明度实现轮播图的算法
2020/08/24 Javascript
使用vue编写一个点击数字计时小游戏
2016/08/31 Javascript
JS 获取HTML标签内的子节点的方法
2016/09/21 Javascript
Nodejs中的JWT和Session的使用
2018/08/21 NodeJs
bootstrap与pagehelper实现分页效果
2018/12/29 Javascript
Vue实现一个图片懒加载插件
2019/03/11 Javascript
JavaScript实现拖拽盒子效果
2020/02/06 Javascript
解决echarts中横坐标值显示不全(自动隐藏)问题
2020/07/20 Javascript
Python使用random和tertools模块解一些经典概率问题
2015/01/28 Python
使用PyCharm配合部署Python的Django框架的配置纪实
2015/11/19 Python
Python单例模式的两种实现方法
2017/08/14 Python
python cx_Oracle的基础使用方法(连接和增删改查)
2017/11/19 Python
python numpy 显示图像阵列的实例
2018/07/02 Python
Python拼接字符串的7种方法总结
2018/11/01 Python
python+selenium实现自动抢票功能实例代码
2018/11/23 Python
python重试装饰器的简单实现方法
2019/01/31 Python
详解Python sys.argv使用方法
2019/05/10 Python
opencv中图像叠加/图像融合/按位操作的实现
2020/04/01 Python
TensorFLow 数学运算的示例代码
2020/04/21 Python
联想香港官方网站及网店:Lenovo香港
2018/04/13 全球购物
什么是虚拟内存?虚拟内存有什么优势?
2012/02/19 面试题
2014年小班元旦活动方案
2014/02/16 职场文书
办理收楼委托书范本
2014/10/09 职场文书
2014年市场部工作总结
2014/11/25 职场文书
2015年物资管理工作总结
2015/05/20 职场文书
MySQL 数据丢失排查案例
2021/05/08 MySQL
详解分布式系统中如何用python实现Paxos
2021/05/18 Python