用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用Python代码来绘制彭罗斯点阵的教程
Apr 03 Python
利用Fn.py库在Python中进行函数式编程
Apr 22 Python
python中ASCII码和字符的转换方法
Jul 09 Python
python3.6.3安装图文教程 TensorFlow安装配置方法
Jun 24 Python
对python中Json与object转化的方法详解
Dec 31 Python
解决python中导入win32com.client出错的问题
Jul 26 Python
Python在OpenCV里实现极坐标变换功能
Sep 02 Python
使用Python代码实现Linux中的ls遍历目录命令的实例代码
Sep 07 Python
python使用pymongo与MongoDB基本交互操作示例
Apr 09 Python
python实现图片,视频人脸识别(dlib版)
Nov 18 Python
python里glob模块知识点总结
Jan 05 Python
python实现批量移动文件
Apr 05 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
php中ob_flush函数和flush函数用法分析
2015/03/18 PHP
适用于初学者的简易PHP文件上传类
2015/10/29 PHP
PHP+Ajax实现上传文件进度条动态显示进度功能
2018/06/04 PHP
extjs fckeditor集成代码
2009/05/10 Javascript
使用jQuery的ajax功能实现的RSS Reader 代码
2009/09/03 Javascript
jquery焦点图片切换(数字标注/手动/自动播放/横向滚动)
2013/01/24 Javascript
javascript设计简单的秒表计时器
2020/09/05 Javascript
jQuery实现简洁的导航菜单效果
2015/11/23 Javascript
js和jquery分别验证单选框、复选框、下拉框
2015/12/17 Javascript
使用jQuery实现一个类似GridView的编辑,更新,取消和删除的功能
2017/03/15 Javascript
Bootstrap 模态对话框只加载一次 remote 数据的完美解决办法
2017/07/09 Javascript
js实现省市级联效果分享
2017/08/10 Javascript
es6+angular1.X+webpack 实现按路由功能打包项目的示例
2017/08/16 Javascript
使用vue中的v-for遍历二维数组的方法
2018/03/07 Javascript
AngularJS与后端php的数据交互方法
2018/08/13 Javascript
vue移动端监听滚动条高度的实现方法
2018/09/03 Javascript
vue2.0 获取从http接口中获取数据,组件开发,路由配置方式
2019/11/04 Javascript
基于Angular 8和Bootstrap 4实现动态主题切换的示例代码
2020/02/11 Javascript
Vue中点击active并第一个默认选中功能的实现
2020/02/24 Javascript
Javascript中Math.max和Math.max.apply的区别和用法详解
2020/08/24 Javascript
手把手教你实现 Promise的使用方法
2020/09/02 Javascript
python实现多线程暴力破解登陆路由器功能代码分享
2015/01/04 Python
用Python实现筛选文件脚本的方法
2018/10/27 Python
Python代码实现删除一个list里面重复元素的方法
2019/04/02 Python
python中for循环把字符串或者字典添加到列表的方法
2019/07/20 Python
Pycharm 字体大小调整设置的方法实现
2019/09/27 Python
浅谈pytorch、cuda、python的版本对齐问题
2020/01/15 Python
一套C++笔试题面试题
2012/06/06 面试题
Java程序员面试题
2013/07/15 面试题
小学毕业感言50字
2014/02/16 职场文书
环保倡议书300字
2014/05/15 职场文书
学校火灾防控方案
2014/06/09 职场文书
运动会广播稿诗歌版
2014/09/12 职场文书
2015年业务员工作总结范文
2015/04/07 职场文书
校运会班级霸气口号
2015/12/24 职场文书
Spring Boot 实现敏感词及特殊字符过滤处理
2021/06/29 Java/Android