详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
深入理解Python中range和xrange的区别
Nov 26 Python
python 通过麦克风录音 生成wav文件的方法
Jan 09 Python
django数据库自动重连的方法实例
Jul 21 Python
django foreignkey(外键)的实现
Jul 29 Python
python使用itchat模块给心爱的人每天发天气预报
Nov 25 Python
pyecharts绘制中国2020肺炎疫情地图的实例代码
Feb 12 Python
jupyter notebook 使用过程中python莫名崩溃的原因及解决方式
Apr 10 Python
使用Python合成图片的实现代码(图片添加个性化文本,图片上叠加其他图片)
Apr 30 Python
Python实现爬取并分析电商评论
Jun 19 Python
Django如何使用asyncio协程和ThreadPoolExecutor多线程
Oct 12 Python
python 日志模块logging的使用场景及示例
Jan 04 Python
Python数据处理的三个实用技巧分享
Apr 01 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
PHP中实现中文字符进制转换原理分析
2011/12/06 PHP
解析PHP获取当前网址及域名的实现代码
2013/06/23 PHP
CodeIgniter视图使用注意事项
2016/01/20 PHP
php实现的SSO单点登录系统接入功能示例分析
2016/10/12 PHP
PHP中常用的魔术方法
2017/04/28 PHP
兼容IE/Firefox/Opera/Safari的检测页面装载完毕的脚本Ext.onReady的实现
2009/07/14 Javascript
jQuery 名称冲突的解决方法
2011/04/08 Javascript
js统计录入文本框中字符的个数并加以限制不超过多少
2014/05/23 Javascript
JS实现鼠标箭头变成一个燃烧烛光效果的方法
2015/02/28 Javascript
JavaScript编程中的Promise使用大全
2015/07/28 Javascript
整理Javascript流程控制语句学习笔记
2015/11/29 Javascript
jQuery使用$.ajax提交表单完整实例
2015/12/11 Javascript
一次$.getJSON不执行的简单记录
2016/07/19 Javascript
基于angularjs实现图片放大镜效果
2016/08/31 Javascript
微信小程序 require机制详解及实例代码
2016/12/14 Javascript
vue的Virtual Dom实现snabbdom解密
2017/05/03 Javascript
基于Bootstrap table组件实现多层表头的实例代码
2017/09/07 Javascript
详解JavaScript实现动态的轮播图效果
2019/04/29 Javascript
jQuery表单选择器用法详解
2019/08/22 jQuery
在vue-cli中引入lodash.js并使用详解
2019/11/13 Javascript
微信小程序地图绘制线段并且测量(实例代码)
2020/01/02 Javascript
JavaScript canvas实现雨滴特效
2021/01/10 Javascript
python实现RSA加密(解密)算法
2016/02/17 Python
Python django实现简单的邮件系统发送邮件功能
2017/07/14 Python
解决python matplotlib imshow无法显示的问题
2018/05/24 Python
python快速编写单行注释多行注释的方法
2019/07/31 Python
Windows 下python3.8环境安装教程图文详解
2020/03/11 Python
经验丰富程序员才知道的8种高级Python技巧
2020/07/27 Python
python判断变量是否为列表的方法
2020/09/17 Python
创业融资计划书
2014/04/25 职场文书
优秀的应届生自荐信
2014/05/23 职场文书
大学生党员个人剖析材料
2014/10/08 职场文书
房屋租赁合同补充协议
2014/10/11 职场文书
2015年助理政工师工作总结
2015/05/26 职场文书
村主任当选感言
2015/08/01 职场文书
使用CSS实现黑白格背景效果
2022/06/01 HTML / CSS