python爬虫教程之爬取百度贴吧并下载的示例


Posted in Python onMarch 07, 2014

测试url:http://tieba.baidu.com/p/27141123322?pn=
begin  1
end   4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url:  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
Python 相关文章推荐
python3生成随机数实例
Oct 20 Python
python中dir函数用法分析
Apr 17 Python
Python3实现的简单验证码识别功能示例
May 02 Python
Python机器学习k-近邻算法(K Nearest Neighbor)实例详解
Jun 25 Python
Python计算开方、立方、圆周率,精确到小数点后任意位的方法
Jul 17 Python
PyCharm使用Docker镜像搭建Python开发环境
Dec 26 Python
Python 使用 prettytable 库打印表格美化输出功能
Dec 26 Python
记一次pyinstaller打包pygame项目为exe的过程(带图片)
Mar 02 Python
使用python-Jenkins批量创建及修改jobs操作
May 12 Python
Python是怎样处理json模块的
Jul 16 Python
基于python判断字符串括号是否闭合{}[]()
Sep 21 Python
Python中Qslider控件实操详解
Feb 20 Python
python处理json数据中的中文
Mar 06 #Python
Python中针对函数处理的特殊方法
Mar 06 #Python
python连接mysql调用存储过程示例
Mar 05 #Python
python益智游戏计算汉诺塔问题示例
Mar 05 #Python
python连接mysql并提交mysql事务示例
Mar 05 #Python
python遍历文件夹并删除特定格式文件的示例
Mar 05 #Python
python的三目运算符和not in运算符使用示例
Mar 03 #Python
You might like
多重?l件?合查?(二)
2006/10/09 PHP
一个用于mysql的数据库抽象层函数库
2006/10/09 PHP
smarty静态实验表明,网络上是错的~呵呵
2006/11/25 PHP
php实现文件下载功能的几个代码分享
2014/05/10 PHP
php 实现简单的登录功能示例【基于thinkPHP框架】
2019/12/02 PHP
图片格式的JavaScript和CSS速查手册
2007/08/20 Javascript
Javascript下判断是否为闰年的Datetime包
2010/10/26 Javascript
使图片旋转的3种解决方案
2013/11/21 Javascript
js阻止默认事件与js阻止事件冒泡示例分享 js阻止冒泡事件
2014/01/27 Javascript
node.js中的fs.writeFile方法使用说明
2014/12/14 Javascript
9个让JavaScript调试更简单的Console命令
2016/11/14 Javascript
Vue 2.0中生命周期与钩子函数的一些理解
2017/05/09 Javascript
Angular4学习笔记之实现绑定和分包
2017/08/01 Javascript
详解Chai.js断言库API中文文档
2018/01/31 Javascript
vue实现图片上传到后台
2020/06/29 Javascript
antd vue 刷新保留当前页面路由,保留选中菜单,保留menu选中操作
2020/08/06 Javascript
详解JavaScript中分解数字的三种方法
2021/01/05 Javascript
[56:29]Secret vs Optic 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
Python中使用MELIAE分析程序内存占用实例
2015/02/18 Python
使用Python编写一个在Linux下实现截图分享的脚本的教程
2015/04/24 Python
解决Matplotlib图表不能在Pycharm中显示的问题
2018/05/24 Python
pycharm: 恢复(reset) 误删文件的方法
2018/10/22 Python
关于pytorch处理类别不平衡的问题
2019/12/31 Python
Django 博客实现简单的全文搜索的示例代码
2020/02/17 Python
python GUI库图形界面开发之PyQt5 Qt Designer工具(Qt设计师)详细使用方法及Designer ui文件转py文件方法
2020/02/26 Python
日本化妆品植村秀俄罗斯官方网站:Shu Uemura俄罗斯
2020/02/01 全球购物
高中的职业生涯规划书
2013/12/28 职场文书
幼儿园中班教师寄语
2014/04/03 职场文书
共产党员批评与自我批评
2014/10/15 职场文书
2015年度物业公司工作总结
2015/04/27 职场文书
保外就医申请书范文
2015/08/06 职场文书
三好学生竞选稿
2015/11/21 职场文书
Golang Gob编码(gob包的使用详解)
2021/05/07 Golang
Django与数据库交互的实现
2021/06/03 Python
MIME类型中application/xml与text/xml的区别介绍
2022/01/18 HTML / CSS
Android Flutter实现3D动画效果示例详解
2022/04/07 Java/Android