Python爬取微信小程序通用方法代码实例详解


Posted in Python onSeptember 29, 2020

背景介绍

最近遇到一个需求,大致就是要获取某个小程序上的数据。心想小程序本质上就是移动端加壳的浏览器,所以想到用Python去获取数据。在网上学习了一下如何实现后,记录一下我的实现过程以及所踩过的小坑。本文关键词:Python,小程序,Charles抓包

目标小程序:

公众号“同城商圈网”左下角“找商家”->汽车维修->小车维修->所有的商家信息,如下图所示:

Python爬取微信小程序通用方法代码实例详解

环境

PC端:Windows 10

移动端:iPhone

软件:Charles

Charles抓包

虽说网上大佬的教程很好很详细,但我想加入几个坑点解释,请点此查看Charles配置教程

Charles清空当前获取到的连接,防止干扰(学会使用这个黄色扫把!很有用)

Python爬取微信小程序通用方法代码实例详解

打开微信小程序进入到指定界面,Charles中显示如下

Python爬取微信小程序通用方法代码实例详解

进入到某个具体商家后,最先请求的是这个

Python爬取微信小程序通用方法代码实例详解

于是我们猜测,这个可能就是小程序相关的http请求,点进去我们看一下

Python爬取微信小程序通用方法代码实例详解

此时手机的界面是这样的

Python爬取微信小程序通用方法代码实例详解

诶,好像就是这个!(其实我也是一个一个试了好久,多试试就会找到啦,当然如果你懂点英文,能看懂左侧的英文就更好了!merchant就是商家的意思~),

但是我们想要获取所有的商家信息怎么办呢?那就先点击Charles上的黄色小扫把~,再返回到商家列表看看

Python爬取微信小程序通用方法代码实例详解

手机界面如下:

Python爬取微信小程序通用方法代码实例详解

没错就是这个请求了!

分析请求

选中左边发送的请求,右边点击Overview选项卡,查看请求信息,我们不难发现这是个POST请求

Python爬取微信小程序通用方法代码实例详解

我们知道POST请求提交的是表单,那么表单数据在哪里呢?我们可以在右边界面,鼠标右击,点击Copy Request就能获取表单数据了!

Python爬取微信小程序通用方法代码实例详解

复制到这里看看:

{"pageIndex":1,"pageSize":50,"regionId":"8","categoryId":"148","orderRule":0}

看到这里,我们就能猜出个大概了,pageIndex是页码,pageSize是每页显示数量,regionId是地区编号,categoryId是货品编号,orderRule是排序规则,至此抓包结束,我们成功抓到了目标包!

本节抓包方法理论上适合所有小程序,其他的你们可以自行尝试哦~

编写python代码

这里我们就简单的写个demo

import requests

url = "http://api.tc688.net/api/services/app/merchant/LoadCategoryMerchants"
header = {
  'Origin':'http://zazhi.tc688.net',
  'Host':'api.tc688.net',
  'User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 13_6_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/7.0.14(0x17000e2e) NetType/WIFI Language/zh_CN',
  'Referer':'http://zazhi.tc688.net/companylist?id=148',
}
data = {"pageIndex":1,"pageSize":50,"regionId":"8","categoryId":"148","orderRule":0}
r = requests.post(url=url,data=data,headers=header)
print(r.text)

运行结果:

Python爬取微信小程序通用方法代码实例详解

完整项目

有关数据处理以及更换地区的详细代码,请访问我的GitHub:GitHub

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之深入变量和引用对象
Sep 24 Python
Python聚类算法之基本K均值实例详解
Nov 20 Python
Python学习思维导图(必看篇)
Jun 26 Python
Python 和 JS 有哪些相同之处
Nov 23 Python
Python numpy生成矩阵、串联矩阵代码分享
Dec 04 Python
pandas实现选取特定索引的行
Apr 20 Python
PyTorch线性回归和逻辑回归实战示例
May 22 Python
Python实现按逗号分隔列表的方法
Oct 23 Python
python用列表生成式写嵌套循环的方法
Nov 08 Python
Python判断两个文件是否相同与两个文本进行相同项筛选的方法
Mar 01 Python
python-django中的APPEND_SLASH实现方法
Jun 21 Python
python-web根据元素属性进行定位的方法
Dec 13 Python
详解如何修改python中字典的键和值
Sep 29 #Python
提高python代码运行效率的一些建议
Sep 29 #Python
Python爬取微信小程序Charles实现过程图解
Sep 29 #Python
Python Charles抓包配置实现流程图解
Sep 29 #Python
python和node.js生成当前时间戳的示例
Sep 29 #Python
python实现图书馆抢座(自动预约)功能的示例代码
Sep 29 #Python
Python 下载Bing壁纸的示例
Sep 29 #Python
You might like
php echo()和print()、require()和include()函数区别说明
2010/03/27 PHP
如何使用jQuery+PHP+MySQL来实现一个在线测试项目
2015/04/26 PHP
laravel解决迁移文件一次删除创建字段报错的问题
2019/10/24 PHP
ThinkPHP 5 AJAX跨域请求头设置实现过程解析
2020/10/28 PHP
Jquery上传插件 uploadify v3.1使用说明
2012/06/18 Javascript
javascript使用isNaN()函数判断变量是否为数字
2013/09/21 Javascript
JavaScript中pop()方法的使用教程
2015/06/09 Javascript
JavaScript中文件上传API详解
2016/04/01 Javascript
JS操作JSON方法总结(推荐)
2016/06/14 Javascript
vue2.0 中#$emit,$on的使用详解
2017/06/07 Javascript
Redux 和 Mobx的选择问题:让你不再困惑!
2017/09/18 Javascript
AngularJs 最新验证手机号码的实例,成功测试通过
2017/11/26 Javascript
layui实现数据表格table分页功能(ajax异步)
2019/07/27 Javascript
Vue ElementUI实现:限制输入框只能输入正整数的问题
2020/07/31 Javascript
js和jquery判断数据类型的4种方法总结
2020/08/28 jQuery
python实现在windows下操作word的方法
2015/04/28 Python
Python Django切换MySQL数据库实例详解
2019/07/16 Python
Python利用scapy实现ARP欺骗的方法
2019/07/23 Python
pytorch中tensor张量数据类型的转化方式
2019/12/31 Python
tensorflow中tf.slice和tf.gather切片函数的使用
2020/01/19 Python
django xadmin 管理器常用显示设置方式
2020/03/11 Python
Python计算信息熵实例
2020/06/18 Python
Django admin组件的使用
2020/10/24 Python
Django通过设置CORS解决跨域问题
2020/11/26 Python
html5中监听canvas内部元素点击事件的三种方法
2019/04/28 HTML / CSS
C#中有没有静态构造函数,如果有是做什么用的?
2016/06/04 面试题
平面设计岗位职责
2013/12/14 职场文书
毕业生求职自荐信怎么写
2014/01/08 职场文书
跑操口号
2014/06/12 职场文书
个性车贴标语
2014/06/24 职场文书
群教个人对照检查材料
2014/08/20 职场文书
学校三八妇女节活动总结
2015/02/06 职场文书
2015年幼儿园后勤工作总结
2015/04/25 职场文书
初中班主任教育随笔
2015/08/15 职场文书
MySQL复制问题的三个参数分析
2021/04/07 MySQL
springboot+VUE实现登录注册
2021/05/27 Vue.js