Python urllib.request对象案例解析


Posted in Python onMay 11, 2020

刚刚接触爬虫,基础的东西得时时回顾才行,这么全面的帖子无论如何也得厚着脸皮转过来啊!

什么是 Urllib 库?

urllib 库 是 Python 内置的 HTTP 请求库。urllib 模块提供的上层接口,使访问 www 和 ftp 上的数据就像访问本地文件一样。

有以下几种模块:

1.urllib.request 请求模块

2. urllib.error 异常处理模块

3. urllib.parse url 解析模块

4. urllib.robotparser robots.txt 解析模块

Urllib 库下的几种模块基本使用如下:

urllib.request

关于 urllib.request: urllib.request 模块提供了最基本的构造 HTTP (或其他协议如 FTP)请求的方法,利用它可以模拟浏览器的一个请求发起过程。利用不同的协议去获取 URL 信息。它的某些接口能够处理基础认证 ( Basic Authenticaton) 、redirections (HTTP 重定向)、 Cookies (浏览器 Cookies)等情况。而这些接口是由 handlers 和 openers 对象提供的。

1.常用的方法有

  • read()==读取文件内容

  • geturl()==获取请求url

  • getheaders()==获取http请求头信息

  • getcode()==获取状态码

  • readlines()==获取一行

2.案例

#coding=utf-8
#import urllib.request
#=========response方法使用
#read()==读取文件内容
#geturl()==获取请求url
#getheaders()==获取http请求头信息
#getcode()==获取状态码
#readlines()==获取一行
#url="http://www.baidu.com";
#response = urllib.request.urlopen(url);
#=====案例1
# str = response.read().decode();#这样通过decode转换为utf8
# with open("baidu.html","w",encoding="utf8") as fp:
#   fp.write(str);
#=====案例2通过字节流写=默认通过read读取的是字节流
# with open("bai.html","wb") as fp:
#   fp.write(response.read()); 
#==使用字节流读取存图片
# image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
# response = urllib.request.urlopen(image_url);
# with open("mv.jpg",'wb') as fp:
#   fp.write(response.read());
#案例3==使用内置函数读取图片
#image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
#urllib.request.urlretrieve(image_url,"chun.jpg");

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python性能优化的20条建议
Oct 25 Python
Python去除列表中重复元素的方法
Mar 20 Python
通过数据库对Django进行删除字段和删除模型的操作
Jul 21 Python
Win7下搭建python开发环境图文教程(安装Python、pip、解释器)
May 17 Python
Python排序算法之选择排序定义与用法示例
Apr 29 Python
python计算列表内各元素的个数实例
Jun 29 Python
python判断一个数是否能被另一个整数整除的实例
Dec 12 Python
python读写csv文件方法详细总结
Jul 05 Python
Python下opencv图像阈值处理的使用笔记
Aug 04 Python
Django之富文本(获取内容,设置内容方式)
May 21 Python
python小白学习包管理器pip安装
Jun 09 Python
Python数据库封装实现代码示例解析
Sep 05 Python
python将dict中的unicode打印成中文实例
May 11 #Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 #Python
Python转换字典成为对象,可以用"."方式访问对象属性实例
May 11 #Python
Python3自定义json逐层解析器代码
May 11 #Python
Python3自定义http/https请求拦截mitmproxy脚本实例
May 11 #Python
Python 找出出现次数超过数组长度一半的元素实例
May 11 #Python
Pycharm如何导入python文件及解决报错问题
May 10 #Python
You might like
PHP面向对象五大原则之接口隔离原则(ISP)详解
2018/04/04 PHP
jquery实现的蓝色二级导航条效果代码
2015/08/24 Javascript
Node.js静态文件服务器改进版
2016/01/10 Javascript
JavaScript中的冒泡排序法
2016/08/03 Javascript
Jquery Easyui对话框组件Dialog使用详解(14)
2016/12/19 Javascript
jQuery使用正则验证15/18身份证的方法示例
2017/04/27 jQuery
Node.js中环境变量process.env的一些事详解
2017/10/26 Javascript
微信小程序左右滑动的实现代码
2017/12/15 Javascript
详解Ubuntu安装angular-cli遇到的坑
2018/09/08 Javascript
微信小程序之swiper滑动面板用法示例
2018/12/04 Javascript
vue遍历生成的输入框 绑定及修改值示例
2019/10/30 Javascript
小程序实现按下录音松开识别语音
2019/11/22 Javascript
ant-design-vue按需加载的坑的解决
2020/05/14 Javascript
vue 项目引入echarts 添加点击事件操作
2020/09/09 Javascript
[01:24:16]2018DOTA2亚洲邀请赛 4.6 全明星赛
2018/04/10 DOTA
python实现的DES加密算法和3DES加密算法实例
2015/06/03 Python
实例Python处理XML文件的方法
2015/08/31 Python
详解PyTorch批训练及优化器比较
2018/04/28 Python
python基于SMTP协议发送邮件
2019/05/31 Python
如何获取Python简单for循环索引
2019/11/21 Python
python中提高pip install速度
2020/02/14 Python
Python基于codecs模块实现文件读写案例解析
2020/05/11 Python
Pytorch 高效使用GPU的操作
2020/06/27 Python
Python爬虫简单运用爬取代理IP的实现
2020/12/01 Python
CSS3中的常用选择器使用示例整理
2016/06/13 HTML / CSS
html2canvas把div保存图片高清图的方法示例
2018/03/05 HTML / CSS
美国知名的家庭连锁百货商店:Boscov’s
2017/07/27 全球购物
Watch Station官方网站:世界一流的手表和智能手表
2020/01/05 全球购物
乌克兰设计师和品牌的服装:Love&Live
2020/04/14 全球购物
UML设计模式笔试题
2014/06/07 面试题
GWT (Google Web Toolkit)有哪些主要的原件组成?
2015/06/08 面试题
精神文明建设先进工作者事迹材料
2014/05/02 职场文书
绵山导游词
2015/02/05 职场文书
个人维稳承诺书
2015/05/04 职场文书
2015暑假社会调查报告
2015/07/13 职场文书
同学聚会感言一句话
2015/07/30 职场文书