python抓取网站的图片并下载到本地的方法


Posted in Python onMay 22, 2018

实例如下所示:

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import urllib,urllib2;
#通过url获取网页
def getHtml(url):
 # 要设置请求头,让服务器知道不是机器人
 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
 headers = {'User-Agent': user_agent}
 request=urllib2.Request(url,headers=headers);
 page = urllib2.urlopen(request);
 html = page.read()
 return html
#通过正则表达式来获取图片地址,并下载到本地
def getImg(html):
 reg = r'src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = imgre.findall(html)
 x = 0
 for imgurl in imglist:
  print imgurl;
  #通过urlretrieve函数把数据下载到本地的D:\\images,所以你需要创建目录
  urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x)
  x = x + 1
html = getHtml("http://www.qiushibaike.com/imgrank/")
getImg(html)

以上这篇python抓取网站的图片并下载到本地的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中关于for循环的碎碎念
Jun 30 Python
简单学习Python多进程Multiprocessing
Aug 29 Python
理论讲解python多进程并发编程
Feb 09 Python
Python3.5装饰器原理及应用实例详解
Apr 30 Python
python实现各种插值法(数值分析)
Jul 30 Python
使用ITK-SNAP进行抠图操作并保存mask的实例
Jul 01 Python
python 将列表里的字典元素合并为一个字典实例
Sep 01 Python
python speech模块的使用方法
Sep 09 Python
pandas apply使用多列计算生成新的列实现示例
Feb 24 Python
对pytorch中x = x.view(x.size(0), -1) 的理解说明
Mar 03 Python
OpenCV-Python实现怀旧滤镜与连环画滤镜
Jun 09 Python
Elasticsearch 聚合查询和排序
Apr 19 Python
Python3实现的字典、列表和json对象互转功能示例
May 22 #Python
python3.5 email实现发送邮件功能
May 22 #Python
python模块smtplib实现纯文本邮件发送功能
May 22 #Python
python邮件发送smtplib使用详解
Jun 16 #Python
Python3多线程操作简单示例
May 22 #Python
Python3基于sax解析xml操作示例
May 22 #Python
Python smtplib实现发送邮件功能
May 22 #Python
You might like
php中存储用户ID和密码到mysql数据库的方法
2013/02/06 PHP
codeigniter集成ucenter1.6双向通信的解决办法
2014/06/12 PHP
PHP之sprintf函数用法详解
2014/11/12 PHP
php 的多进程操作实践案例分析
2020/02/28 PHP
JavaScript 模拟用户单击事件
2009/12/31 Javascript
JavaScript类和继承 constructor属性
2010/03/04 Javascript
jQuery实现的自适应焦点图效果完整实例
2016/08/24 Javascript
浅谈jQuery中事情的动态绑定
2017/02/12 Javascript
jQuery+PHP+Mysql实现抽奖程序
2020/04/12 jQuery
使用konva和vue-konva库实现拖拽滑块验证功能
2020/04/27 Javascript
微信小程序绘制半圆(弧形)进度条
2020/11/18 Javascript
[48:32]VGJ.T vs Fnatic 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
python中日期和时间格式化输出的方法小结
2015/03/19 Python
Python实现简单多线程任务队列
2016/02/27 Python
django之session与分页(实例讲解)
2017/11/13 Python
Tensorflow卷积神经网络实例
2018/05/24 Python
python将字符串以utf-8格式保存在txt文件中的方法
2018/10/30 Python
在python中使用requests 模拟浏览器发送请求数据的方法
2018/12/26 Python
python 实现矩阵按对角线打印
2019/11/29 Python
python 字典套字典或列表的示例
2019/12/16 Python
Pytorch中.new()的作用详解
2020/02/18 Python
python3 自动打印出最新版本执行的mysql2redis实例
2020/04/09 Python
Python改变对象的字符串显示的方法
2020/08/01 Python
浅析python 字典嵌套
2020/09/29 Python
浅谈anaconda python 版本对应关系
2020/10/07 Python
python 利用jieba.analyse进行 关键词提取
2020/12/17 Python
La Senza官网:北美顶尖性感内衣品牌
2018/08/03 全球购物
统计学专业毕业生的自我评价分享
2013/11/28 职场文书
七年级英语教学反思
2014/01/15 职场文书
幼儿园教师教学反思
2014/02/06 职场文书
班组长竞聘书
2014/03/31 职场文书
水利专业大学生职业生涯规划书范文
2014/09/17 职场文书
社区五一劳动节活动总结
2015/02/09 职场文书
七年级作文之英语老师
2019/10/28 职场文书
Nginx反爬虫策略,防止UA抓取网站
2021/03/31 Servers
go:垃圾回收GC触发条件详解
2021/04/24 Golang