Python实现简单的获取图片爬虫功能示例


Posted in Python onJuly 12, 2017

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考,具体如下:

简单Python爬虫,获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python编程中的反模式实例分析
Dec 08 Python
详解python使用递归、尾递归、循环三种方式实现斐波那契数列
Jan 16 Python
pandas通过索引进行排序的示例
Nov 16 Python
使用python绘制二元函数图像的实例
Feb 12 Python
Python中Numpy ndarray的使用详解
May 24 Python
使用django的ORM框架按月统计近一年内的数据方法
Jul 18 Python
Python使用字典实现的简单记事本功能示例
Aug 15 Python
Python单元测试工具doctest和unittest使用解析
Sep 02 Python
python为Django项目上的每个应用程序创建不同的自定义404页面(最佳答案)
Mar 09 Python
django创建超级用户时指定添加其它字段方式
May 14 Python
jupyter notebook运行命令显示[*](解决办法)
May 18 Python
Python爬虫之自动爬取某车之家各车销售数据
Jun 02 Python
python文件特定行插入和替换实例详解
Jul 12 #Python
梯度下降法介绍及利用Python实现的方法示例
Jul 12 #Python
python3之微信文章爬虫实例讲解
Jul 12 #Python
python脚本替换指定行实现步骤
Jul 11 #Python
Python书单 不将就
Jul 11 #Python
Python编写一个闹钟功能
Jul 11 #Python
python自定义异常实例详解
Jul 11 #Python
You might like
虫族 Zerg 历史背景
2020/03/14 星际争霸
php获取网页里所有图片并存入数组的方法
2015/04/06 PHP
yii分页组件用法实例分析
2015/12/28 PHP
PHP+Ajax实现验证码的实时验证
2016/07/20 PHP
利用PHP将图片转换成base64编码的实现方法
2016/09/13 PHP
javascript 多种搜索引擎集成的页面实现代码
2010/01/02 Javascript
jQuery 图片切换插件(代码比较少)
2012/05/07 Javascript
jQuery插件windowScroll实现单屏滚动特效
2015/07/14 Javascript
js绘制圆形和矩形的方法
2015/08/05 Javascript
jQuery取得iframe中元素的常用方法详解
2016/01/14 Javascript
利用fecha进行JS日期处理
2016/11/21 Javascript
codeMirror插件使用讲解
2017/01/16 Javascript
javascript 网页进度条简单实例
2017/02/22 Javascript
Angularjs+bootstrap+table多选(全选)支持单击行选中实现编辑、删除功能
2017/03/27 Javascript
Vue.js在使用中的一些注意知识点
2017/04/29 Javascript
vue prop传值类型检验方式
2020/07/30 Javascript
[02:08]我的刀塔不可能这么可爱 胡晓桃_1
2014/06/20 DOTA
[02:28]DOTA2 2015国际邀请赛中国区预选赛首日现场百态
2015/05/26 DOTA
如何解决django配置settings时遇到Could not import settings 'conf.local'
2014/11/18 Python
python3+dlib实现人脸识别和情绪分析
2018/04/21 Python
Python Web框架之Django框架cookie和session用法分析
2019/08/16 Python
python实现统计代码行数的小工具
2019/09/19 Python
如何安装2019Pycharm最新版本(详细教程)
2019/09/26 Python
手把手教你如何用Pycharm2020.1.1配置远程连接的详细步骤
2020/08/07 Python
Python将list元素转存为CSV文件的实现
2020/11/16 Python
localstorage和sessionstorage使用记录(推荐)
2017/05/23 HTML / CSS
英国在线药房和在线医生:LloydsPharmacy
2019/10/21 全球购物
什么是动态端口(Dynamic Ports)?动态端口的范围是多少?
2014/12/12 面试题
毕业生的自我鉴定该怎么写
2013/12/02 职场文书
统计岗位职责
2014/02/21 职场文书
医学专业大学生职业生涯规划书
2014/10/25 职场文书
2015迎新晚会开场白
2015/07/17 职场文书
谢师宴学生答谢词
2015/09/30 职场文书
幽默导游词应该怎么写?
2019/08/26 职场文书
写一个Python脚本下载哔哩哔哩舞蹈区的所有视频
2021/05/31 Python
企业开发CSS命名BEM代码规范实践
2022/02/12 HTML / CSS