使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
Python open读写文件实现脚本
Sep 06 Python
Python实现的检测web服务器健康状况的小程序
Sep 17 Python
Python3.6正式版新特性预览
Dec 15 Python
Python简单生成随机姓名的方法示例
Dec 27 Python
对python中的logger模块全面讲解
Apr 28 Python
基于Python log 的正确打开方式
Apr 28 Python
python 给DataFrame增加index行名和columns列名的实现方法
Jun 08 Python
Python  unittest单元测试框架的使用
Sep 08 Python
pycharm创建scrapy项目教程及遇到的坑解析
Aug 15 Python
python Yaml、Json、Dict之间的转化
Oct 19 Python
利用python实现汉诺塔游戏
Mar 01 Python
Python中的pprint模块
Nov 27 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
ASP知识讲座四
2006/10/09 PHP
编写漂亮的代码 - 将后台程序与前端程序分开
2008/04/23 PHP
php判断ip黑名单程序代码实例
2014/02/24 PHP
PHP获取数组最大值下标的方法
2015/05/12 PHP
PHP面向对象程序设计高级特性详解(接口,继承,抽象类,析构,克隆等)
2016/12/02 PHP
让iframe框架网页在任何浏览器下自动伸缩
2006/08/18 Javascript
js下用层来实现select的title提示属性
2010/02/23 Javascript
火狐4、谷歌12不支持Jquery Validator的解决方法分享
2011/06/20 Javascript
js加载读取内容及显示与隐藏div示例
2014/02/13 Javascript
node.js中的events.EventEmitter.listenerCount方法使用说明
2014/12/08 Javascript
javascript批量修改文件编码格式的方法
2015/01/27 Javascript
举例讲解JavaScript substring()的使用方法
2015/11/09 Javascript
js获取本机操作系统类型的两种方法
2015/12/19 Javascript
基于Bootstrap实现的下拉菜单手机端不能选择菜单项的原因附解决办法
2016/07/22 Javascript
Ajax使用原生态JS验证用户名是否存在
2020/05/26 Javascript
分享十三个最佳JavaScript数据网格库
2017/04/07 Javascript
vue获取dom元素注意事项
2017/12/28 Javascript
Vue引用第三方datepicker插件无法监听datepicker输入框的值的解决
2018/01/27 Javascript
Nodejs中怎么实现函数的串行执行
2019/03/02 NodeJs
laypage.js分页插件使用方法详解
2019/07/27 Javascript
ES6中new Function()语法及应用实例分析
2020/02/19 Javascript
vue 实现图片懒加载功能
2020/12/31 Vue.js
在Django框架中运行Python应用全攻略
2015/07/17 Python
python判断变量是否为int、字符串、列表、元组、字典的方法详解
2020/02/13 Python
调整Jupyter notebook的启动目录操作
2020/04/10 Python
详解Django关于StreamingHttpResponse与FileResponse文件下载的最优方法
2021/01/07 Python
css3媒体查询中device-width和width的区别详解
2020/03/27 HTML / CSS
HTML5公共页面提取作为公用代码的方法
2020/06/30 HTML / CSS
美国领先的水果篮送货公司和新鲜水果供应商:The Fruit Company
2018/02/13 全球购物
JoJo Maman Bébé爱尔兰官网:英国最受欢迎的精品母婴品牌
2020/12/20 全球购物
PHP面试题集
2016/12/18 面试题
人事行政主管岗位职责
2013/12/22 职场文书
2014年勤工助学工作总结
2014/11/24 职场文书
求职简历自荐信怎么写
2015/03/26 职场文书
JS精髓原型链继承及构造函数继承问题纠正
2022/06/16 Javascript
Windows Server 版本 20H2 于 8 月 9 日停止支持,Win10 版本 21H1 将于 12 月结束支
2022/07/23 数码科技