Python实现JS解密并爬取某音漫客网站


Posted in Python onOctober 23, 2020

首先打开网站

https://www.zymk.cn/1/37988.html

打开开发者工具

Python实现JS解密并爬取某音漫客网站

选择XHR标签页,没有找到什么

再查看一下这些图片的URL值

http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp

尝试搜索图片元素

Python实现JS解密并爬取某音漫客网站Python实现JS解密并爬取某音漫客网站

发现有一个js文件,打开搜索

Python实现JS解密并爬取某音漫客网站

发现这里有一个疑点,这不是html里面的字段吗,那么 “i.getPicUrl(e)” 不就是那个图片的URL的值了吗

在这里下一个断点,走你

Python实现JS解密并爬取某音漫客网站

果然,这个就那个图片URL生成的切入点,现在就是看调用栈,找到这个函数的起点,点击右侧的 ”e.init“,这里有一个setInitData函数,从名字来看,应该就是设置初始数据的地方,在这里下一个断点,进去看看

Python实现JS解密并爬取某音漫客网站

这里有一个this.imgpath,这个应该就是图片的URL值了,点击F10,再单步调式,来到了charcode函数

Python实现JS解密并爬取某音漫客网站

进去看看,这里应该就是加密函数了

Python实现JS解密并爬取某音漫客网站

这里一步步调式,不要着急,来到了这里

Python实现JS解密并爬取某音漫客网站

继续单步调式,在第二次打开这么VM文件的时候,”__cr.imgpath“这个看起来很熟悉呀

Plain Text
"L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N:8-M@-IN-AL-:N"

打开页面源代码,就在这里啦,不仅仅有图片的URL加密值,还有其他数据,这些都是在后面图片URL拼接需要使用到的

Python实现JS解密并爬取某音漫客网站

现在我们再重新看看那个加密函数,它无非就是遍历那个加密值的每个字符,获取其Unicode值,再与__cr.chapter_id进行相关运算,然后再得到的Unicode数值返回字符

现在我们可以用python仿写这个算法

Python实现JS解密并爬取某音漫客网站

接下就是平常get请求获取必要的数据了,通过正则获取元素,拼接,以下是源码

Python实现JS解密并爬取某音漫客网站 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用python分割TXT文件成4K的TXT文件
May 23 Python
Python编程对列表中字典元素进行排序的方法详解
May 26 Python
Python3 加密(hashlib和hmac)模块的实现
Nov 23 Python
100行Python代码实现自动抢火车票(附源码)
Jan 11 Python
利用pandas读取中文数据集的方法
Jul 25 Python
基于树莓派的语音对话机器人
Jun 17 Python
对python3 sort sorted 函数的应用详解
Jun 27 Python
Django中的FBV和CBV用法详解
Sep 15 Python
python+selenium 脚本实现每天自动登记的思路详解
Mar 11 Python
Python Tornado批量上传图片并显示功能
Mar 26 Python
Django admin 实现search_fields精确查询实例
Mar 30 Python
在Python3.74+PyCharm2020.1 x64中安装使用Kivy的详细教程
Aug 07 Python
解决Python 写文件报错TypeError的问题
Oct 23 #Python
python 利用Pyinstaller打包Web项目
Oct 23 #Python
python logging模块的使用详解
Oct 23 #Python
Pycharm自动添加文件头注释和函数注释参数的方法
Oct 23 #Python
Python中免验证跳转到内容页的实例代码
Oct 23 #Python
python对 MySQL 数据库进行增删改查的脚本
Oct 22 #Python
Python提取视频中图片的示例(按帧、按秒)
Oct 22 #Python
You might like
六酷社区论坛HOME页清新格调免费版 下载
2007/03/07 PHP
php文件缓存类汇总
2014/11/21 PHP
php实现批量修改文件名称的方法
2016/07/23 PHP
学习PHP Cookie处理函数
2016/08/09 PHP
PHP基于imagick扩展实现合成图片的两种方法【附imagick扩展下载】
2017/11/14 PHP
javascript中万恶的function实例分析
2011/05/25 Javascript
JS 表单验证大全
2011/11/23 Javascript
Extjs 继承Ext.data.Store不起作用原因分析及解决
2013/04/15 Javascript
jquery ui对话框实例代码
2013/05/10 Javascript
JavaScript中的Promise使用详解
2015/06/24 Javascript
Bootstrap每天必学之滚动监听
2016/03/16 Javascript
js 颜色选择插件
2017/01/23 Javascript
详解Vuejs2.0之异步跨域请求
2017/04/20 Javascript
vue-router 导航钩子的具体使用方法
2017/08/31 Javascript
JavaScript函数式编程(Functional Programming)组合函数(Composition)用法分析
2019/05/22 Javascript
js实现窗口全屏示例详解
2019/09/17 Javascript
js+h5 canvas实现图片验证码
2020/10/11 Javascript
Python的Django框架中的数据过滤功能
2015/07/17 Python
详解Python的Twisted框架中reactor事件管理器的用法
2016/05/25 Python
python如何在终端里面显示一张图片
2016/08/17 Python
Python IDLE 错误:IDLE''s subprocess didn''t make connection 的解决方案
2017/02/13 Python
Python2.7基于淘宝接口获取IP地址所在地理位置的方法【测试可用】
2017/06/07 Python
Python使用pip安装报错:is not a supported wheel on this platform的解决方法
2018/01/23 Python
Python数据处理numpy.median的实例讲解
2018/04/02 Python
介绍一款python类型检查工具pyright(推荐)
2019/07/03 Python
浅谈python 调用open()打开文件时路径出错的原因
2020/06/05 Python
python的setattr函数实例用法
2020/12/16 Python
舒适的豪华鞋:Taryn Rose
2018/05/03 全球购物
《一件运动衫》教学反思
2014/02/19 职场文书
房屋继承公证书
2014/04/10 职场文书
关于环保的标语
2014/06/13 职场文书
村干部四风问题整改措施
2014/09/30 职场文书
装饰技术负责人岗位职责
2015/04/13 职场文书
2015年幼儿园安全工作总结
2015/05/12 职场文书
MySql存储过程之逻辑判断和条件控制
2021/05/26 MySQL
SQL SERVER触发器详解
2022/02/24 SQL Server