Python实现简单的获取图片爬虫功能示例


Posted in Python onJuly 12, 2017

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考,具体如下:

简单Python爬虫,获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
在 Django/Flask 开发服务器上使用 HTTPS
Jul 03 Python
python采集博客中上传的QQ截图文件
Jul 18 Python
常用python编程模板汇总
Feb 12 Python
python检索特定内容的文本文件实例
Jun 05 Python
Python3的介绍、安装和命令行的认识(推荐)
Oct 20 Python
一篇文章了解Python中常见的序列化操作
Jun 20 Python
cProfile Python性能分析工具使用详解
Jul 22 Python
python PyQt5/Pyside2 按钮右击菜单实例代码
Aug 17 Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 Python
TensorFlow实现批量归一化操作的示例
Apr 22 Python
PyCharm+PyQt5+QtDesigner配置详解
Aug 12 Python
Python集合的基础操作
Nov 01 Python
python文件特定行插入和替换实例详解
Jul 12 #Python
梯度下降法介绍及利用Python实现的方法示例
Jul 12 #Python
python3之微信文章爬虫实例讲解
Jul 12 #Python
python脚本替换指定行实现步骤
Jul 11 #Python
Python书单 不将就
Jul 11 #Python
Python编写一个闹钟功能
Jul 11 #Python
python自定义异常实例详解
Jul 11 #Python
You might like
一些常用的php函数
2006/12/06 PHP
隐藏你的.php文件的实现方法
2007/03/19 PHP
PHP中的session永不过期的解决思路及实现方法分享
2011/04/20 PHP
php设计模式 Command(命令模式)
2011/06/26 PHP
zend framework重定向方法小结
2016/05/28 PHP
PHP vsprintf()函数格式化字符串操作原理解析
2020/07/14 PHP
jQuery技巧总结
2011/01/01 Javascript
Javascript学习笔记-详解in运算符
2011/09/13 Javascript
JavaScript获取URL汇总
2015/06/08 Javascript
javascript日期格式化方法小结
2015/12/17 Javascript
Jquery ajax请求导出Excel表格的实现代码
2016/06/08 Javascript
ECMAScript6 新特性范例大全
2017/03/24 Javascript
nodeJS服务器的创建和重新启动的实现方法
2018/05/12 NodeJs
解决Layui选择全部,换页checkbox复选框重新勾选的问题方法
2018/08/14 Javascript
微信小程序 flexbox layout快速实现基本布局的解决方案
2020/03/24 Javascript
使用JavaScript实现网页秒表功能(含开始、暂停、继续、重置功能)
2020/06/05 Javascript
antd Form组件方法getFieldsValue获取自定义组件的值操作
2020/10/29 Javascript
[06:40]2014DOTA2西雅图国际邀请赛 DK战队巡礼
2014/07/07 DOTA
Python入门之modf()方法的使用
2015/05/15 Python
Python实现简易端口扫描器代码实例
2017/03/15 Python
django admin 后台实现三级联动的示例代码
2018/06/22 Python
python之pyqt5通过按钮改变Label的背景颜色方法
2019/06/13 Python
python模拟实现斗地主发牌
2020/01/07 Python
Python读取表格类型文件代码实例
2020/02/17 Python
Python函数生成器原理及使用详解
2020/03/12 Python
Python为何不支持switch语句原理详解
2020/10/21 Python
使用HTML和CSS实现的标签云效果(附demo)
2021/02/03 HTML / CSS
Foot Locker德国官方网站:美国运动服和鞋类零售商
2018/11/01 全球购物
提高EJB性能都有哪些技巧
2012/03/25 面试题
交警正风肃纪剖析材料
2014/10/29 职场文书
接待员岗位职责
2015/02/13 职场文书
导游词之海南-南湾猴岛
2019/10/12 职场文书
JavaScript 防篡改对象的用法示例
2021/04/24 Javascript
golang中的空slice案例
2021/04/27 Golang
python geopandas读取、创建shapefile文件的方法
2021/06/29 Python
关于@OnetoMany关系映射的排序问题,使用注解@OrderBy
2021/12/06 Java/Android