python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
树莓派中python获取GY-85九轴模块信息示例
Dec 05 Python
python 3利用BeautifulSoup抓取div标签的方法示例
May 28 Python
python3之模块psutil系统性能信息使用
May 30 Python
python基于物品协同过滤算法实现代码
May 31 Python
python 给DataFrame增加index行名和columns列名的实现方法
Jun 08 Python
Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】
Apr 05 Python
详解Python 解压缩文件
Apr 09 Python
python3调用windows dos命令的例子
Aug 14 Python
python+selenium定时爬取丁香园的新型冠状病毒数据并制作出类似的地图(部署到云服务器)
Feb 09 Python
python如何解析复杂sql,实现数据库和表的提取的实例剖析
May 15 Python
如何用Matplotlib 画三维图的示例代码
Jul 28 Python
jupyter notebook远程访问不了的问题解决方法
Jan 11 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
smarty中js的调用方法示例
2014/10/27 PHP
浅析JS中document对象的一些重要属性
2014/03/06 Javascript
JQuery中clone方法复制节点
2015/05/18 Javascript
Javascript编写2048小游戏
2015/07/07 Javascript
js制作带有遮罩弹出层实现登录注册表单特效代码分享
2015/09/05 Javascript
jQuery插件 Jqplot图表实例
2016/06/18 Javascript
JS实现弹出居中的模式窗口示例
2016/06/20 Javascript
JavaScript中Number对象的toFixed() 方法详解
2016/09/02 Javascript
BootStrap Validator使用注意事项(必看篇)
2016/09/28 Javascript
angular.JS实现网页禁用调试、复制和剪切
2017/03/31 Javascript
JS如何实现在页面上快速定位(锚点跳转问题)
2017/08/14 Javascript
JavaScript代码判断输入的字符串是否含有特殊字符和表情代码实例
2017/08/17 Javascript
使用 vue.js 构建大型单页应用
2018/02/10 Javascript
JS Object.preventExtensions(),Object.seal()与Object.freeze()用法实例分析
2018/08/25 Javascript
详解webpack+ES6+Sass搭建多页面应用
2018/11/05 Javascript
在移动端使用vue-router和keep-alive的方法示例
2018/12/02 Javascript
详解Vue 全局变量,局部变量
2019/04/17 Javascript
微信小程序如何引用外部js,外部样式,公共页面模板
2019/07/23 Javascript
通过实例解析JavaScript for in及for of区别
2020/06/15 Javascript
[42:06]2019国际邀请赛全明星赛 8.23
2019/09/05 DOTA
Python的Asyncore异步Socket模块及实现端口转发的例子
2016/06/14 Python
python打开windows应用程序的实例
2019/06/28 Python
解决Python3 控制台输出InsecureRequestWarning问题
2019/07/15 Python
Python collections中的双向队列deque简单介绍详解
2019/11/04 Python
tensorflow通过模型文件,使用tensorboard查看其模型图Graph方式
2020/01/23 Python
django的模型类管理器——数据库操作的封装详解
2020/04/01 Python
python和c语言哪个更适合初学者
2020/06/22 Python
解决keras,val_categorical_accuracy:,0.0000e+00问题
2020/07/02 Python
Pycharm新手使用教程(图文详解)
2020/09/17 Python
韩国三星集团旗下时尚品牌官网:SSF SHOP
2016/08/02 全球购物
俄罗斯汽车零件和配件在线商店:CarvilleShop
2019/11/29 全球购物
德国家具、照明、家居用品网上商店:Wayfair.de
2020/02/13 全球购物
12月红领巾广播稿
2014/02/13 职场文书
政风行风整改方案
2014/10/25 职场文书
导游词之上海豫园
2019/10/24 职场文书
Java数据结构之链表相关知识总结
2021/06/18 Java/Android