用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现代理服务功能实例
Nov 15 Python
python实现数通设备端口监控示例
Apr 02 Python
python 字典 按key值大小 倒序取值的实例
Jul 06 Python
Python引用计数操作示例
Aug 23 Python
python3.6使用pickle序列化class的方法
Oct 22 Python
Python小工具之消耗系统指定大小内存的方法
Dec 03 Python
django 自定义过滤器的实现
Feb 26 Python
浅析Python 读取图像文件的性能对比
Mar 07 Python
python防止随意修改类属性的实现方法
Aug 21 Python
pycharm激活方法到2099年(激活流程)
Sep 22 Python
python操作xlsx格式文件并读取
Jun 02 Python
Django drf请求模块源码解析
Jun 08 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
php的ajax框架xajax入门与试用介绍
2010/12/19 PHP
php遍历数组的方法分享
2012/03/22 PHP
php有效防止同一用户多次登录
2015/11/19 PHP
PHP 爬取网页的主要方法
2018/07/13 PHP
PHP实现文字写入图片功能
2019/02/18 PHP
PHP操作XML中XPath的应用示例
2019/07/04 PHP
jQuery 事件队列调整方法
2009/09/18 Javascript
jQuery EasyUI API 中文文档 - ComboGrid 组合表格
2011/10/13 Javascript
JQuery 常用方法和事件详细介绍
2013/04/18 Javascript
js生成缩略图后上传并利用canvas重绘
2014/05/15 Javascript
JavaScript判断数组是否包含指定元素的方法
2015/07/01 Javascript
javascript获取select值的方法分析
2015/07/02 Javascript
详解Node全局变量global模块
2017/09/28 Javascript
vue中SPA单页面应用程序详解
2017/11/07 Javascript
JavaScript私有变量实例详解
2019/01/24 Javascript
详解JavaScript 为什么要有 Symbol 类型?
2019/04/03 Javascript
小程序组件之自定义顶部导航实例
2019/06/12 Javascript
jquery插件实现轮播图效果
2020/10/19 jQuery
详解JavaScript中分解数字的三种方法
2021/01/05 Javascript
[04:21]狐狸妈带你到现场 DOTA2 TI中国区预选赛线下赛路线指引
2014/05/22 DOTA
[01:15:16]DOTA2-DPC中国联赛 正赛 Elephant vs Aster BO3 第一场 1月26日
2021/03/11 DOTA
python Django模板的使用方法(图文)
2013/11/04 Python
Python中对象迭代与反迭代的技巧总结
2016/09/17 Python
Python简单定义与使用字典dict的方法示例
2017/07/25 Python
python使用 zip 同时迭代多个序列示例
2019/07/06 Python
Python守护进程实现过程详解
2020/02/10 Python
业务代表的岗位职责
2013/11/16 职场文书
自考生自我评价分享
2014/01/18 职场文书
安全保证书范文
2014/04/29 职场文书
防灾减灾日活动总结
2014/08/26 职场文书
租房协议书
2014/09/12 职场文书
高中生个性发展自我评价
2015/03/09 职场文书
致我们终将逝去的青春观后感
2015/06/10 职场文书
2016年春季运动会广播稿
2015/08/19 职场文书
80后创业总结的9条职场用人思想,记得收藏
2019/08/13 职场文书
Java中常用解析工具jackson及fastjson的使用
2021/06/28 Java/Android