使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
Python模块学习 re 正则表达式
May 19 Python
Python字符串处理之count()方法的使用
May 18 Python
Python 3.x读写csv文件中数字的方法示例
Aug 29 Python
Python实现读取txt文件中的数据并绘制出图形操作示例
Feb 26 Python
python3 selenium自动化 下拉框定位的例子
Aug 23 Python
基于python全局设置id 自动化测试元素定位过程解析
Sep 04 Python
详解Django将秒转换为xx天xx时xx分
Sep 27 Python
python的命名规则知识点总结
Oct 04 Python
PyQt5中多线程模块QThread使用方法的实现
Jan 31 Python
Python分析最近大火的网剧《隐秘的角落》
Jul 02 Python
Python 抓取数据存储到Redis中的操作
Jul 16 Python
python 实现aes256加密
Nov 27 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
PHP脚本数据库功能详解(下)
2006/10/09 PHP
PHP 多维数组排序(usort,uasort)
2010/06/30 PHP
php whois查询API制作方法
2011/06/23 PHP
php读取excel文件的简单实例
2013/08/26 PHP
帝国CMS留言板回复后发送EMAIL通知客户
2015/07/06 PHP
PHP随手笔记整理之PHP脚本和JAVA连接mysql数据库
2015/11/25 PHP
PHP自定义函数实现数组比较功能示例
2017/10/19 PHP
简单实用的js调试logger组件实现代码
2010/11/20 Javascript
使用Json比用string返回数据更友好,也更面向对象一些
2011/09/13 Javascript
node.js中的path.join方法使用说明
2014/12/08 Javascript
js命名空间写法示例
2015/12/18 Javascript
JS原型、原型链深入理解
2016/02/27 Javascript
React.js入门实例教程之创建hello world 的5种方式
2016/05/11 Javascript
客户端验证用户名和密码的方法详解
2016/06/16 Javascript
JavaScript微信定位功能实现方法
2016/11/29 Javascript
Vue数据驱动模拟实现2
2017/01/11 Javascript
简单实现js选项卡切换效果
2017/02/09 Javascript
JavaScript基本类型值-Number类型
2017/02/24 Javascript
React利用插件和不用插件实现双向绑定的方法详解
2017/07/03 Javascript
使用jQuery 操作table 完成单元格合并的实例
2017/12/27 jQuery
js技巧之十几行的代码实现vue.watch代码
2018/06/09 Javascript
vue中v-model的应用及使用详解
2018/06/27 Javascript
jquery无缝图片轮播组件封装
2020/11/25 jQuery
JS寄快递地址智能解析的实现代码
2020/07/16 Javascript
js实现省级联动(数据结构优化)
2020/07/17 Javascript
JavaScript 中判断变量是否为数字的示例代码
2020/10/22 Javascript
[05:13]TI4 中国战队 机场出征!!
2014/07/07 DOTA
python 控制语句
2011/11/03 Python
Python json模块使用实例
2015/04/11 Python
Python下线程之间的共享和释放示例
2015/05/04 Python
为Python的Tornado框架配置使用Jinja2模板引擎的方法
2016/06/30 Python
Python数据模型与Python对象模型的相关总结
2021/01/26 Python
加拿大百叶窗和窗帘定制网站:Blinds
2017/01/30 全球购物
小学开学寄语
2014/01/19 职场文书
读书活动实施方案
2014/03/10 职场文书
班委竞选稿范文
2015/11/21 职场文书