Python urllib.request对象案例解析


Posted in Python onMay 11, 2020

刚刚接触爬虫,基础的东西得时时回顾才行,这么全面的帖子无论如何也得厚着脸皮转过来啊!

什么是 Urllib 库?

urllib 库 是 Python 内置的 HTTP 请求库。urllib 模块提供的上层接口,使访问 www 和 ftp 上的数据就像访问本地文件一样。

有以下几种模块:

1.urllib.request 请求模块

2. urllib.error 异常处理模块

3. urllib.parse url 解析模块

4. urllib.robotparser robots.txt 解析模块

Urllib 库下的几种模块基本使用如下:

urllib.request

关于 urllib.request: urllib.request 模块提供了最基本的构造 HTTP (或其他协议如 FTP)请求的方法,利用它可以模拟浏览器的一个请求发起过程。利用不同的协议去获取 URL 信息。它的某些接口能够处理基础认证 ( Basic Authenticaton) 、redirections (HTTP 重定向)、 Cookies (浏览器 Cookies)等情况。而这些接口是由 handlers 和 openers 对象提供的。

1.常用的方法有

  • read()==读取文件内容

  • geturl()==获取请求url

  • getheaders()==获取http请求头信息

  • getcode()==获取状态码

  • readlines()==获取一行

2.案例

#coding=utf-8
#import urllib.request
#=========response方法使用
#read()==读取文件内容
#geturl()==获取请求url
#getheaders()==获取http请求头信息
#getcode()==获取状态码
#readlines()==获取一行
#url="http://www.baidu.com";
#response = urllib.request.urlopen(url);
#=====案例1
# str = response.read().decode();#这样通过decode转换为utf8
# with open("baidu.html","w",encoding="utf8") as fp:
#   fp.write(str);
#=====案例2通过字节流写=默认通过read读取的是字节流
# with open("bai.html","wb") as fp:
#   fp.write(response.read()); 
#==使用字节流读取存图片
# image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
# response = urllib.request.urlopen(image_url);
# with open("mv.jpg",'wb') as fp:
#   fp.write(response.read());
#案例3==使用内置函数读取图片
#image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
#urllib.request.urlretrieve(image_url,"chun.jpg");

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 实现归并排序算法
Jun 05 Python
pygame学习笔记(1):矩形、圆型画图实例
Apr 15 Python
Python中查看文件名和文件路径
Mar 31 Python
Python中使用多进程来实现并行处理的方法小结
Aug 09 Python
解决python3中自定义wsgi函数,make_server函数报错的问题
Nov 21 Python
python集合比较(交集,并集,差集)方法详解
Sep 13 Python
python模块常用用法实例详解
Oct 17 Python
flask实现验证码并验证功能
Dec 05 Python
Python使用psutil获取进程信息的例子
Dec 17 Python
pyqt5 QlistView列表显示的实现示例
Mar 24 Python
TensorFLow 数学运算的示例代码
Apr 21 Python
安装Anaconda3及使用Jupyter的方法
Oct 27 Python
python将dict中的unicode打印成中文实例
May 11 #Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 #Python
Python转换字典成为对象,可以用"."方式访问对象属性实例
May 11 #Python
Python3自定义json逐层解析器代码
May 11 #Python
Python3自定义http/https请求拦截mitmproxy脚本实例
May 11 #Python
Python 找出出现次数超过数组长度一半的元素实例
May 11 #Python
Pycharm如何导入python文件及解决报错问题
May 10 #Python
You might like
PHP中SESSION使用中的一点经验总结
2012/03/30 PHP
php文件夹与文件目录操作函数介绍
2013/09/09 PHP
PHP同时连接多个mysql数据库示例代码
2014/03/17 PHP
php实现比较两个文件夹异同的方法
2015/06/18 PHP
php 伪造HTTP_REFERER页面URL来源的三种方法
2016/09/22 PHP
PHP序列化操作方法分析
2016/09/28 PHP
PHP编写daemon process 实例详解
2016/11/13 PHP
PHP实现下载远程图片保存到本地的方法
2017/06/19 PHP
PHP count_chars()函数讲解
2019/02/14 PHP
php设计模式之工厂模式用法经典实例分析
2019/09/20 PHP
刷新页面的几种方法小结(JS,ASP.NET)
2014/01/07 Javascript
jQuery实现动画效果的简单实例
2014/01/27 Javascript
node.js中的http.response.removeHeader方法使用说明
2014/12/14 Javascript
JavaScript将Web页面内容导出到Word及Excel的方法
2015/02/13 Javascript
JavaScript使用yield模拟多线程的方法
2015/03/19 Javascript
jQuery禁用键盘后退屏蔽F5刷新及禁用右键单击
2016/01/22 Javascript
详解AngularJS ui-sref的简单使用
2017/04/24 Javascript
详解使用Typescript开发node.js项目(简单的环境配置)
2017/10/09 Javascript
vue实现微信分享朋友圈,发送朋友的示例讲解
2018/02/10 Javascript
node实现的爬虫功能示例
2018/05/04 Javascript
值得收藏的八个常用的js正则表达式
2018/10/19 Javascript
对python中使用requests模块参数编码的不同处理方法
2018/05/18 Python
Python 从列表中取值和取索引的方法
2018/12/25 Python
Python3.5 Pandas模块之Series用法实例分析
2019/04/23 Python
详解Python self 参数
2019/08/30 Python
python3读取csv文件任意行列代码实例
2020/01/13 Python
pytorch实现CNN卷积神经网络
2020/02/19 Python
找Python安装目录,设置环境路径以及在命令行运行python脚本实例
2020/03/09 Python
详解Python 循环嵌套
2020/07/09 Python
java程序员面试交流
2012/11/29 面试题
银行简历自我评价
2014/02/11 职场文书
党员活动日总结
2014/05/05 职场文书
物流管理专业求职信
2014/05/29 职场文书
自我介绍演讲稿范文
2014/08/21 职场文书
公司离职证明标准格式
2014/11/18 职场文书
小学语文教学反思范文
2016/03/03 职场文书