Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
使用Python对MySQL数据操作
Apr 06 Python
go和python变量赋值遇到的一个问题
Aug 31 Python
Python基于回溯法子集树模板解决选排问题示例
Sep 07 Python
python爬虫headers设置后无效的解决方法
Oct 21 Python
python方向键控制上下左右代码
Jan 20 Python
Python中defaultdict与lambda表达式用法实例小结
Apr 09 Python
Python定义一个跨越多行的字符串的多种方法小结
Jul 19 Python
详解Python3中setuptools、Pip安装教程
Jun 18 Python
np.newaxis 实现为 numpy.ndarray(多维数组)增加一个轴
Nov 30 Python
解决Python spyder显示不全df列和行的问题
Apr 20 Python
五分钟带你搞懂python 迭代器与生成器
Aug 30 Python
解决pytorch 保存模型遇到的问题
Mar 03 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
Php部分常见问题总结
2006/10/09 PHP
Thinkphp搭建包括JS多语言的多语言项目实现方法
2014/11/24 PHP
php用正则判断是否为数字的方法
2016/03/25 PHP
thinkphp框架下实现登录、注册、找回密码功能
2016/04/06 PHP
php mysql实现mysql_select_db选择数据库
2016/12/30 PHP
用jQuery简化JavaScript开发分析
2009/02/19 Javascript
StringTemplate遇见jQuery冲突的解决方法
2011/09/22 Javascript
使用JS 清空File控件的路径值
2013/07/08 Javascript
深入理解javascript动态插入技术
2013/11/12 Javascript
jquery批量设置属性readonly和disabled的方法
2014/01/24 Javascript
JavaScript判断是否为数组的3种方法及效率比较
2015/04/01 Javascript
JS判断是否在微信浏览器打开的简单实例(推荐)
2016/08/24 Javascript
详解Vue 事件驱动和依赖追踪
2017/04/22 Javascript
ES6扩展运算符用法实例分析
2017/10/31 Javascript
AngularJS中重新加载当前路由页面的方法
2018/03/09 Javascript
Taro集成Redux快速上手的方法示例
2018/06/21 Javascript
JavaScript Canvas实现验证码
2020/08/02 Javascript
vue实现动态显示与隐藏底部导航的方法分析
2019/02/11 Javascript
vue生命周期的探索
2019/04/03 Javascript
解决Vue中的生命周期beforeDestory不触发的问题
2020/07/21 Javascript
关于你不想知道的所有Python3 unicode特性
2014/11/28 Python
Python使用multiprocessing实现一个最简单的分布式作业调度系统
2016/03/14 Python
Python中表达式x += y和x = x+y 的区别详解
2017/06/20 Python
教你使用python画一朵花送女朋友
2018/03/29 Python
对numpy中数组转置的求解以及向量内积计算方法
2018/10/31 Python
python3.6+django2.0+mysql搭建网站过程详解
2019/07/24 Python
Python性能分析工具Profile使用实例
2019/11/19 Python
css3动画过渡实现鼠标跟随导航效果
2018/02/08 HTML / CSS
CSS3的文字阴影—text-shadow的使用方法
2012/12/25 HTML / CSS
你应该知道的30个css选择器
2014/03/19 HTML / CSS
资生堂英国官网:Shiseido英国
2020/12/30 全球购物
《长江之歌》教学反思
2014/04/17 职场文书
2014世界杯球队球队口号
2014/06/05 职场文书
2014年酒店工作总结与计划
2014/11/17 职场文书
二手车转让协议书
2015/01/29 职场文书
完美处理python与anaconda环境变量的冲突问题
2021/04/07 Python