使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
easy_install python包安装管理工具介绍
Feb 10 Python
使用PyCharm配合部署Python的Django框架的配置纪实
Nov 19 Python
Python只用40行代码编写的计算器实例
May 10 Python
python3.7.0的安装步骤
Aug 27 Python
tensorflow使用神经网络实现mnist分类
Sep 08 Python
python隐藏终端执行cmd命令的方法
Jun 24 Python
Python基本语法之运算符功能与用法详解
Oct 22 Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 Python
Python利用Xpath选择器爬取京东网商品信息
Jun 01 Python
keras分类模型中的输入数据与标签的维度实例
Jul 03 Python
Python 如何测试文件是否存在
Jul 31 Python
利用python进行文件操作
Dec 04 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
php中的一个中文字符串截取函数
2007/02/14 PHP
php简单的会话类代码
2011/08/08 PHP
php图片加水印原理(超简单的实例代码)
2013/01/18 PHP
实例介绍PHP的Reflection反射机制
2014/08/05 PHP
PHP中的类型提示(type hinting)功能介绍
2015/07/01 PHP
关于PHP求解三数之和问题详析
2020/11/09 PHP
用javascript实现的仿Flash广告图片轮换效果
2007/04/24 Javascript
浅说js变量
2011/05/25 Javascript
Extjs4 关于Store的一些操作(加载/回调/添加)
2013/04/18 Javascript
你必须知道的Javascript知识点之"this指针"的应用
2013/04/23 Javascript
jquery利用ajax调用后台方法实例
2013/08/23 Javascript
微信小程序 后台https域名绑定和免费的https证书申请详解
2016/11/10 Javascript
jQuery DateTimePicker 日期和时间插件示例
2017/01/22 Javascript
vue下跨域设置的相关介绍
2017/08/26 Javascript
BetterScroll 在移动端滚动场景的应用
2017/09/18 Javascript
ES6使用export和import实现模块化的方法
2018/09/10 Javascript
浅谈开发eslint规则
2018/10/01 Javascript
微信小程序 确认框的实现(附代码)
2019/07/23 Javascript
es6数组的flat(),flatMap()函数用法实例分析
2020/04/18 Javascript
jQuery 动态粒子效果示例代码
2020/07/07 jQuery
vue中组件通信详解(父子组件, 爷孙组件, 兄弟组件)
2020/07/27 Javascript
python:pandas合并csv文件的方法(图书数据集成)
2018/04/12 Python
浅谈django orm 优化
2018/08/18 Python
python得到qq句柄,并显示在前台的方法
2018/10/14 Python
python创造虚拟环境方法总结
2019/03/04 Python
HTML5地理定位实例
2014/10/15 HTML / CSS
英国领先的豪华时尚家居网上商店:Amara
2019/08/12 全球购物
新东方旗下远程教育网站:新东方在线
2020/03/19 全球购物
Oasis服装官网:时尚女装在线
2020/07/09 全球购物
Python里面search()和match()的区别
2016/09/21 面试题
中职生自我鉴定范文
2013/10/03 职场文书
祖国在我心中演讲稿600字
2014/09/23 职场文书
模范教师事迹材料
2014/12/16 职场文书
公务员政审材料范文
2014/12/23 职场文书
写给同事的离职感言
2015/08/04 职场文书
如何解决springcloud feign 首次调用100%失败的问题
2021/06/23 Java/Android