python下载图片实现方法(超简单)


Posted in Python onJuly 21, 2017

我们有时候会需要在网上查找并下载图片,当数量比较少的时候,点击右键保存,很轻松就可以实现图片的下载,但是有些图片进行了特殊设置,点击右键没有显示保存选项,或者需要下载很多图片,这样的情况,写一段Python爬虫代码就可以轻松解决!

一、页面抓取

#coding=utf-8
import urllib

def getHtml(url):

  page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("https://tieba.baidu.com/p/5582243679")

print html

页面数据抓取过程定义了getHtml()函数,其作用是给getHtml()传递一个网址,最终进行整个页面的下载。

二、页面数据筛选

import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)

  return imglist

html = getHtml("https://tieba.baidu.com/p/5582243679")

print getImg(html)

页面数据筛选中,定义了一个新的函数getImg(),该函数的功能是筛选出.jpg格式的图片地址。

三、图片下载

#coding=utf-8
import urllib

import re

def getHtml(url):

  page = urllib.urlopen(url)

  html = page.read()
    return html

def getImg(html):

  reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
  
imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:

    urllib.urlretrieve(imgurl,'%s.jpg' % x)

    x+=1

html = getHtml("https://tieba.baidu.com/p/5582243679")

print getImg(html)

通过for循环获得所有符合条件的图片网址,并采用urllib.urlretrieve()方法,将远程数据下载到本地,并重新命名!

以下是补充

如下所示:

import urllib.request
response = urllib.request.urlopen('https://3water.com/g/500/600')
cat_img = response.read()

with open('cat_500_600.jpg','wb') as f:
 f.write(cat_img)

urlopen()括号里既可以是一个字符串也可以是一个request对象,当传入字符串的时候会转换成一个request对象,因此代码

response = urllib.request.urlopen('https://3water.com/g/500/600') 也可以写成

req = urllib.request.Request('https://3water.com/g/500/600')

1、response = urllib.request.urlopen(req)
2、responce还有geturl,info,getcode方法

代码with open('cat_500_600.jpg','wb') as f:

f.write(cat_img)等价于

1、f = open('cat_500_600.jpg','wb')

2、try:

3、 data = f.write(cat_img)

4、finally:

5、 f.close()

以上这篇python下载图片实现方法(超简单)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现过滤单个Android程序日志脚本分享
Jan 16 Python
解决Linux系统中python matplotlib画图的中文显示问题
Jun 15 Python
Python+OpenCV人脸检测原理及示例详解
Oct 19 Python
详解Python3 基本数据类型
Apr 19 Python
基于Python的PIL库学习详解
May 10 Python
Pyqt5 实现跳转界面并关闭当前界面的方法
Jun 19 Python
pytorch中的自定义数据处理详解
Jan 06 Python
Python3加密解密库Crypto的RSA加解密和签名/验签实现方法实例
Feb 11 Python
pycharm 添加解释器的方法步骤
Aug 31 Python
Python自动化xpath实现自动抢票抢货
Sep 19 Python
python的列表生成式,生成器和generator对象你了解吗
Mar 16 Python
python 判断文件或文件夹是否存在
Mar 18 Python
Python基于Pymssql模块实现连接SQL Server数据库的方法详解
Jul 20 #Python
Python使用内置json模块解析json格式数据的方法
Jul 20 #Python
Python轻量级ORM框架Peewee访问sqlite数据库的方法详解
Jul 20 #Python
Python函数式编程
Jul 20 #Python
python 换位密码算法的实例详解
Jul 19 #Python
python实现rsa加密实例详解
Jul 19 #Python
Python中标准库OS的常用方法总结大全
Jul 19 #Python
You might like
JAVA/JSP学习系列之七
2006/10/09 PHP
PHP面向对象分析设计的经验原则
2008/09/20 PHP
Ha0k 0.3 PHP 网页木马修改版
2009/10/11 PHP
PHP提交表单失败后如何保留已经填写的信息
2014/06/20 PHP
PHP实现获取域名的方法小结
2014/11/05 PHP
php模仿asp Application对象在线人数统计实现方法
2015/01/04 PHP
php include类文件超时问题处理
2015/02/06 PHP
在php7中MongoDB实现模糊查询的方法详解
2017/05/03 PHP
thinkphp5 migrate数据库迁移工具
2018/02/20 PHP
PHP7如何开启Opcode打造强悍性能详解
2018/05/11 PHP
jQuery实现个性翻牌效果导航菜单的方法
2015/03/09 Javascript
每天一篇javascript学习小结(Function对象)
2015/11/16 Javascript
js判断移动端是否安装某款app的多种方法
2015/12/18 Javascript
详解WordPress开发中get_current_screen()函数的使用
2016/01/11 Javascript
jQuery 限制输入字符串长度
2016/06/20 Javascript
jQuery mobile的header和footer在点击屏幕的时候消失的解决办法
2016/07/01 Javascript
基于js实现checkbox批量选中操作
2016/11/22 Javascript
jquery滚动条插件(可以自定义)
2016/12/11 Javascript
解决Jquery下拉框数据动态获取的问题
2018/01/25 jQuery
React 使用browserHistory项目访问404问题解决
2018/06/01 Javascript
Vue.directive使用注意(小结)
2018/08/31 Javascript
如何在JavaScript中谨慎使用代码注释
2019/06/21 Javascript
Python提取网页中超链接的方法
2016/09/18 Python
启动targetcli时遇到错误解决办法
2017/10/26 Python
解决tensorflow读取本地MNITS_data失败的原因
2020/06/22 Python
Python之qq自动发消息的示例代码
2021/02/18 Python
Pytorch自定义Dataset和DataLoader去除不存在和空数据的操作
2021/03/03 Python
在HTML5中如何使用CSS建立不可选的文字
2014/10/17 HTML / CSS
size?丹麦官网:英国伦敦的球鞋精品店
2019/04/15 全球购物
Michael Kors英国官网:美国奢侈品品牌
2019/11/13 全球购物
高中生期末评语大全
2014/01/28 职场文书
元宵节主持词
2014/03/25 职场文书
学生不讲诚信检讨书
2014/09/29 职场文书
区域经理岗位职责
2015/02/02 职场文书
2015中学政教处工作总结
2015/07/22 职场文书
六种css3实现的边框过渡效果
2021/04/22 HTML / CSS