Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python strip lstrip rstrip使用方法
Sep 06 Python
Python 读取指定文件夹下的所有图像方法
Apr 27 Python
python3第三方爬虫库BeautifulSoup4安装教程
Jun 19 Python
OPENCV去除小连通区域,去除孔洞的实例讲解
Jun 21 Python
python使用多进程的实例详解
Sep 19 Python
使用Python进行目录的对比方法
Nov 01 Python
Python3实现取图片中特定的像素替换指定的颜色示例
Jan 24 Python
django框架model orM使用字典作为参数,保存数据的方法分析
Jun 24 Python
Django3.0 异步通信初体验(小结)
Dec 04 Python
浅谈Python描述数据结构之KMP篇
Sep 06 Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 Python
微软开源最强Python自动化神器Playwright(不用写一行代码)
Jan 05 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
PHP4实际应用经验篇(3)
2006/10/09 PHP
PHP n个不重复的随机数生成代码
2009/06/23 PHP
php中替换字符串中的空格为逗号','的方法
2014/06/09 PHP
PHP两种去掉数组重复值的方法比较
2014/06/19 PHP
php访问数组最后一个元素的函数end()用法
2015/03/18 PHP
WordPress中的shortcode短代码功能使用详解
2016/05/17 PHP
用jquery实现下拉菜单效果的代码
2010/07/25 Javascript
javascript 45种缓动效果 非常酷
2011/06/28 Javascript
深入剖析JavaScript面向对象编程
2016/07/12 Javascript
基于JavaScript实现鼠标箭头移动图片跟着移动
2016/08/30 Javascript
Bootstrap导航简单实现代码
2017/03/06 Javascript
js canvas实现画图、滤镜效果
2018/11/27 Javascript
Node.js 如何利用异步提升任务处理速度
2019/01/07 Javascript
详解vuex数据传输的两种方式及this.$store undefined的解决办法
2019/08/26 Javascript
[02:40]DOTA2英雄基础教程 先知
2013/11/29 DOTA
python 采集中文乱码问题的完美解决方法
2016/09/27 Python
python 简单搭建阻塞式单进程,多进程,多线程服务的实例
2017/11/01 Python
在cmd命令行里进入和退出Python程序的方法
2018/05/12 Python
python pandas中对Series数据进行轴向连接的实例
2018/06/08 Python
Python 正则表达式匹配字符串中的http链接方法
2018/12/25 Python
HTML5通用接口详解
2016/06/12 HTML / CSS
HTML5 表单验证失败的提示语问题
2017/07/13 HTML / CSS
详解如何在登录过期后跳出Ifram框架
2020/09/10 HTML / CSS
6号汽车旅馆预订:Motel 6
2018/02/11 全球购物
高中生毕业自我鉴定
2013/10/10 职场文书
医科学校毕业生自荐信
2013/11/09 职场文书
心理健康教育制度
2014/01/27 职场文书
博士生导师推荐信
2014/07/08 职场文书
群众路线教师自我剖析材料
2014/09/29 职场文书
2014标准社保办理委托书
2014/10/06 职场文书
整改报告格式
2014/11/06 职场文书
群众路线教育实践活动学习笔记内容
2014/11/06 职场文书
商务邀请函
2015/01/30 职场文书
党校毕业个人总结
2015/02/28 职场文书
工作收入证明模板
2015/06/12 职场文书
《悬崖边的树》读后感2篇
2019/12/02 职场文书