python3中编码获取网页的实例方法


Posted in Python onNovember 16, 2020

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python里大整数相乘相关技巧指南
Sep 12 Python
Python采用socket模拟TCP通讯的实现方法
Nov 19 Python
Ubuntu安装Jupyter Notebook教程
Oct 18 Python
Python中XlsxWriter模块简介与用法分析
Apr 24 Python
利用python打开摄像头及颜色检测方法
Aug 03 Python
python将视频转换为全字符视频
Apr 26 Python
Python:二维列表下标互换方式(矩阵转置)
Dec 02 Python
Python实现word2Vec model过程解析
Dec 16 Python
Python 模拟动态产生字母验证码图片功能
Dec 24 Python
浅谈Python访问MySQL的正确姿势
Jan 07 Python
Python3与fastdfs分布式文件系统如何实现交互
Jun 23 Python
Python+SeaTable实现计算两个日期间的工作日天数
Jul 07 Python
Python3中小括号()、中括号[]、花括号{}的区别详解
Nov 15 #Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 #Python
python re的findall和finditer的区别详解
Nov 15 #Python
Python获取android设备cpu和内存占用情况
Nov 15 #Python
Python __slots__的使用方法
Nov 15 #Python
Python descriptor(描述符)的实现
Nov 15 #Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 #Python
You might like
一个PHP的远程图片抓取函数分享
2013/09/25 PHP
php多功能图片处理类分享(php图片缩放类)
2014/03/14 PHP
php基于闭包实现函数的自调用(递归)实例分析
2016/11/11 PHP
PHP关键特性之命名空间实例详解
2017/05/06 PHP
PHP时间处理类操作示例
2018/09/05 PHP
零基础学JavaScript最新动画教程+iso光盘下载
2008/01/22 Javascript
jquery $.each() 使用小探
2013/08/23 Javascript
javascript实现动态模态绑定grid过程代码
2014/09/22 Javascript
JavaScript实现把数字转换成中文
2015/06/29 Javascript
Vue.js每天必学之方法与事件处理器
2016/09/06 Javascript
JS键盘版计算器的制作方法
2016/12/03 Javascript
原生js实现弹出层登录拖拽功能
2016/12/05 Javascript
JS正则获取HTML元素的方法
2017/03/31 Javascript
JQuery Ajax 异步操作之动态添加节点功能
2017/05/24 jQuery
jQuery实现文字超过1行、2行或规定的行数时自动加省略号的方法
2018/03/28 jQuery
jQuery无冲突模式详解
2019/01/17 jQuery
Vue使用Clipboard.JS在h5页面中复制内容实例详解
2019/09/03 Javascript
vue+axios实现post文件下载
2019/09/25 Javascript
JS中的const命令你真懂它吗
2020/03/08 Javascript
[45:16]完美世界DOTA2联赛循环赛 IO vs FTD BO2第二场 11.05
2020/11/06 DOTA
python连接mongodb操作数据示例(mongodb数据库配置类)
2013/12/31 Python
Python中的包和模块实例
2014/11/22 Python
Python中IPYTHON入门实例
2015/05/11 Python
Python实现视频下载功能
2017/03/14 Python
对python中array.sum(axis=?)的用法介绍
2018/06/28 Python
OpenCV+python手势识别框架和实例讲解
2018/08/03 Python
Pandas DataFrame中的tuple元素遍历的实现
2019/10/23 Python
Python requests模块安装及使用教程图解
2020/06/30 Python
python tqdm实现进度条的示例代码
2020/11/10 Python
详解使用canvas保存网页为pdf文件支持跨域
2018/11/23 HTML / CSS
智乐游戏测试笔试题
2014/05/21 面试题
大学生自我鉴定
2013/12/08 职场文书
国际贸易实训报告
2014/11/05 职场文书
中学生学习保证书
2015/02/26 职场文书
借条格式范本
2015/05/25 职场文书
小学大队委竞选口号
2015/12/25 职场文书