python3中编码获取网页的实例方法


Posted in Python onNovember 16, 2020

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
R vs. Python 数据分析中谁与争锋?
Oct 18 Python
python 爬虫 批量获取代理ip的实例代码
May 22 Python
Python判断以什么结尾以什么开头的实例
Oct 27 Python
详解python中的Turtle函数库
Nov 19 Python
Python3基础教程之递归函数简单示例
Jun 07 Python
用Python抢火车票的简单小程序实现解析
Aug 14 Python
Numpy 中的矩阵求逆实例
Aug 26 Python
淘宝秒杀python脚本 扫码登录版
Sep 19 Python
python ffmpeg任意提取视频帧的方法
Feb 21 Python
Python实现井字棋小游戏
Mar 09 Python
OpenCV+python实现实时目标检测功能
Jun 24 Python
python使用dlib进行人脸检测和关键点的示例
Dec 05 Python
Python3中小括号()、中括号[]、花括号{}的区别详解
Nov 15 #Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 #Python
python re的findall和finditer的区别详解
Nov 15 #Python
Python获取android设备cpu和内存占用情况
Nov 15 #Python
Python __slots__的使用方法
Nov 15 #Python
Python descriptor(描述符)的实现
Nov 15 #Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 #Python
You might like
解决phpmyadmin 乱码,支持gb2312和utf-8
2006/11/20 PHP
php 删除记录同时删除图片文件的实现代码
2010/05/12 PHP
php加速器eAccelerator的配置参数、API详解
2014/05/05 PHP
php禁止直接从浏览器输入地址访问.php文件的方法
2014/11/04 PHP
php实现的操作excel类详解
2016/01/15 PHP
Yii2 输出xml格式数据的方法
2016/05/03 PHP
phpstorm 正则匹配删除空行、注释行(替换注释行为空行)
2018/01/21 PHP
django中的ajax组件教程详解
2018/10/18 PHP
jQuery创建平滑的页面滚动(顶部或底部)
2013/02/26 Javascript
JQUERY实现左侧TIPS滑进滑出效果示例
2013/06/27 Javascript
判断JS对象是否拥有某种属性的两种方式
2013/12/02 Javascript
jquery中的ajax方法怎样通过JSONP进行远程调用
2014/05/04 Javascript
js简单的点击返回顶部效果实现方法
2015/04/10 Javascript
javascript实现继承的简单实例
2015/07/26 Javascript
jQuery实现时尚漂亮的弹出式对话框实例
2015/08/07 Javascript
JavaScript编程中布尔对象的基本使用
2015/10/25 Javascript
JS实现显示带倒影的图片横排居中放大展示特效实例【测试可用】
2016/08/23 Javascript
完美实现js焦点轮播效果(二)(图片可滚动)
2017/03/07 Javascript
浅谈Vue项目骨架屏注入实践
2019/08/05 Javascript
微信小程序拼接图片链接无底洞深入探究
2019/09/03 Javascript
在Vue中实现随hash改变响应菜单高亮
2020/03/09 Javascript
[58:32]EG vs Liquid 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
使用python实现拉钩网上的FizzBuzzWhizz问题示例
2014/05/05 Python
举例讲解Python中的死锁、可重入锁和互斥锁
2015/11/05 Python
Python优化技巧之利用ctypes提高执行速度
2016/09/11 Python
python虚拟环境的安装配置图文教程
2017/10/20 Python
Python实现感知器模型、两层神经网络
2017/12/19 Python
python使用pyecharts库画地图数据可视化的实现
2020/03/25 Python
python 实现 hive中类似 lateral view explode的功能示例
2020/05/18 Python
pycharm 的Structure界面设置操作
2021/02/05 Python
详解CSS3的图层阴影和文字阴影效果使用
2016/06/09 HTML / CSS
html5中去掉input type date默认样式的方法
2018/09/06 HTML / CSS
canvas小画板之平滑曲线的实现
2020/08/12 HTML / CSS
领导干部考察材料
2014/02/08 职场文书
中药学专业毕业生推荐信
2014/07/10 职场文书
2015年学校信息技术工作总结
2015/05/25 职场文书