Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python验证企业工商注册码
Oct 25 Python
Python基于hashlib模块的文件MD5一致性加密验证示例
Feb 10 Python
华为校园招聘上机笔试题 扑克牌大小(python)
Apr 22 Python
python 判断linux进程,并杀死进程的实现方法
Jul 01 Python
django多个APP的urls设置方法(views重复问题解决)
Jul 19 Python
pygame实现非图片按钮效果
Oct 29 Python
一文了解python 3 字符串格式化 F-string 用法
Mar 04 Python
python中逻辑与或(and、or)和按位与或异或(&amp;、|、^)区别
Aug 05 Python
python中entry用法讲解
Dec 04 Python
selenium与xpath之获取指定位置的元素的实现
Jan 26 Python
pandas中DataFrame数据合并连接(merge、join、concat)
May 30 Python
Python自动化测试PO模型封装过程详解
Jun 22 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
火车头discuz6.1 完美采集的php接口文件
2009/09/13 PHP
php删除指定目录的方法
2015/04/03 PHP
Yii框架中jquery表单验证插件用法示例
2016/10/18 PHP
Laravel框架中VerifyCsrfToken报错问题的解决
2017/08/30 PHP
php的对象传值与引用传值代码实例讲解
2021/02/26 PHP
枚举JavaScript对象的函数
2006/12/22 Javascript
jQuery操作input type=radio的实现代码
2012/06/14 Javascript
向当前style sheet中插入一个新的style实现方法
2013/04/01 Javascript
JavaScript中的关联数组问题
2015/03/04 Javascript
JavaScript 表单处理实现代码
2015/04/13 Javascript
javascript实现表单提交后,提交按钮不可用的方法
2015/04/18 Javascript
三种AngularJS中获取数据源的方式
2016/02/02 Javascript
JQuery组件基于Bootstrap的DropDownList(完整版)
2016/07/05 Javascript
彻底学会Angular.js中的transclusion
2017/03/12 Javascript
ubuntu编译nodejs所需的软件并安装
2017/09/12 NodeJs
解决vue项目nginx部署到非根目录下刷新空白的问题
2018/09/27 Javascript
Node.js API详解之 net模块实例分析
2020/05/18 Javascript
python根据出生日期获得年龄的方法
2015/03/31 Python
Python实现把xml或xsl转换为html格式
2015/04/08 Python
简单介绍Python中的floor()方法
2015/05/15 Python
Python定义一个跨越多行的字符串的多种方法小结
2018/07/19 Python
Python数据结构之栈、队列及二叉树定义与用法浅析
2018/12/27 Python
python 中如何获取列表的索引
2019/07/02 Python
python安装dlib库报错问题及解决方法
2020/03/16 Python
python 比较字典value的最大值的几种方法
2020/04/17 Python
css3实现文字扫光渐变动画效果的示例
2017/11/07 HTML / CSS
门诊挂号室室长岗位职责
2013/11/27 职场文书
餐饮业员工工作决心书
2014/03/11 职场文书
新闻传媒系求职信范文
2014/04/19 职场文书
信息管理与信息系统专业求职信
2014/06/21 职场文书
微笑面对生活演讲稿
2014/09/23 职场文书
镇班子对照检查材料思想汇报
2014/09/24 职场文书
2015年高校教师个人工作总结
2015/05/25 职场文书
《绝招》教学反思
2016/02/20 职场文书
css3 filter属性的使用简介
2021/03/31 HTML / CSS
分析并发编程之LongAdder原理
2021/06/29 Java/Android