python抓取豆瓣图片并自动保存示例学习


Posted in Python onJanuary 10, 2014

环境Python 2.7.6,BS4,在powershell或命令行均可运行。请确保安装了BS模块

# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的图片。
from bs4 import BeautifulSoup
import os, sys, urllib2
# 创建文件夹,昨天刚学会
path = os.getcwd()          # 获取此脚本所在目录
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 my_girl = soup.find_all('img')   
    # 加入结束检测,写的不好....
 if my_girl ==[]:
  print u'已经全部抓取完毕'
  sys.exit(0)
 print u'开始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link
  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上现学的
   code.write(content2)
 page = int(page) + 1
 print u'开始抓取下一页'
 print 'the %s page' % page
 page_loop(page)
page_loop().
Python 相关文章推荐
Python深入学习之对象的属性
Aug 31 Python
用Python编写一个国际象棋AI程序
Nov 28 Python
研究Python的ORM框架中的SQLAlchemy库的映射关系
Apr 25 Python
python读写ini配置文件方法实例分析
Jun 30 Python
Python模块结构与布局操作方法实例分析
Jul 24 Python
python logging模块的使用总结
Jul 09 Python
python实现读取excel文件中所有sheet操作示例
Aug 09 Python
Series和DataFrame使用简单入门
Nov 13 Python
Keras设置以及获取权重的实现
Jun 19 Python
Python基于gevent实现文件字符串查找器
Aug 11 Python
python源码剖析之PyObject详解
May 18 Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 Python
python文件比较示例分享
Jan 10 #Python
python发送伪造的arp请求
Jan 09 #Python
python抓取京东价格分析京东商品价格走势
Jan 09 #Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
You might like
PHP 图片上传实现代码 带详细注释
2010/04/29 PHP
php版微信公众号自定义分享内容实现方法
2016/09/22 PHP
Gird组件 Part-3:范例RSSFeed Viewer
2007/03/10 Javascript
javascript之typeof、instanceof操作符使用探讨
2013/05/19 Javascript
JS将秒换成时分秒实现代码
2013/09/03 Javascript
JS实现可点击展开与关闭的左侧广告代码
2015/09/02 Javascript
简单谈谈JavaScript的同步与异步
2015/12/31 Javascript
对Js OOP编程 创建对象的一些全面理解
2016/07/26 Javascript
AngularJs expression详解及简单示例
2016/09/01 Javascript
使用AngularJS2中的指令实现按钮的切换效果
2017/03/27 Javascript
微信小程序实现倒计时60s获取验证码
2020/04/17 Javascript
使用clipboard.js实现复制功能的示例代码
2017/10/16 Javascript
微信小程序MUI侧滑导航菜单示例(Popup弹出式,左侧不动,右侧滑动)
2019/01/23 Javascript
利用JavaScript的Map提升性能的方法详解
2019/08/14 Javascript
Node.js 在本地生成日志文件的方法
2020/02/07 Javascript
微信小程序onShareTimeline()实现分享朋友圈
2021/01/07 Javascript
python对象及面向对象技术详解
2016/07/19 Python
解决Pycharm无法import自己安装的第三方module问题
2018/05/18 Python
Python返回数组/List长度的实例
2018/06/23 Python
对numpy中向量式三目运算符详解
2018/10/31 Python
pyqt5 获取显示器的分辨率的方法
2019/06/18 Python
Pandas中resample方法详解
2019/07/02 Python
Python基于数列实现购物车程序过程详解
2020/06/09 Python
基于Tensorflow读取MNIST数据集时网络超时的解决方式
2020/06/22 Python
德国知名健康零食网上商店:Seeberger
2017/07/27 全球购物
加拿大领先的优质厨具产品在线购物网站:Golda’s Kitchen
2017/11/17 全球购物
澳洲网红粉泥面膜:Sand & Sky
2019/08/13 全球购物
工程招投标邀请书
2014/01/30 职场文书
假面舞会策划方案
2014/05/29 职场文书
单位委托书范本(3篇)
2014/09/18 职场文书
2014普法依法治理工作总结
2014/12/18 职场文书
2016年学校禁毒宣传活动工作总结
2016/04/05 职场文书
大学校园餐饮创业计划书
2019/08/07 职场文书
Nginx服务器如何设置url链接
2021/03/31 Servers
CSS3 制作的彩虹按钮样式
2021/04/11 HTML / CSS
pytorch加载预训练模型与自己模型不匹配的解决方案
2021/05/13 Python