浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)


Posted in Python onAugust 12, 2019

Python2中编码相关的问题很是让人蛋疼,特别是中文字符。

比如本文所述的中文网页GBK编码的诡异问题。

现象

例如:盲录?氓??,其实网页里面正常的应该是会员

分析

接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函数求值得到的结果为unicode

eval(repr())出来值为

盲录?氓??

通过查表上述6个汉字对应

c3a4 c2bc c29a c3a5 c291 c298

而上面内容对应的UTF-8值就是会员

解决方法

相当诡异的是本身是unicode编码,却被当作GBK系列来解码,结果导致乱码。因此将这些字符先编码再解决解决问题。

encode('raw_unicode_escape').decode()

以上这篇浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Django框架中运行Python应用全攻略
Jul 17 Python
Python简单获取自身外网IP的方法
Sep 18 Python
Python中str.join()简单用法示例
Mar 20 Python
python 获取当天每个准点时间戳的实例
May 22 Python
Python自动化导出zabbix数据并发邮件脚本
Aug 16 Python
对Python中一维向量和一维向量转置相乘的方法详解
Aug 26 Python
python3 mmh3安装及使用方法
Oct 09 Python
Python TCP通信客户端服务端代码实例
Nov 21 Python
PyCharm无法引用自身项目解决方式
Feb 12 Python
python ImageDraw类实现几何图形的绘制与文字的绘制
Feb 26 Python
django列表筛选功能的实现代码
Mar 27 Python
python如何读取和存储dict()与.json格式文件
Jun 25 Python
基于Python2、Python3中reload()的不同用法介绍
Aug 12 #Python
Python递归函数 二分查找算法实现解析
Aug 12 #Python
基于Python安装pyecharts所遇的问题及解决方法
Aug 12 #Python
Django实现发送邮件找回密码功能
Aug 12 #Python
使用pyecharts生成Echarts网页的实例
Aug 12 #Python
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
Aug 12 #Python
python利用itertools生成密码字典并多线程撞库破解rar密码
Aug 12 #Python
You might like
全国FM电台频率大全 - 24 贵州省
2020/03/11 无线电
PHP添加Xdebug扩展的方法
2014/02/12 PHP
Codeigniter+PHPExcel实现导出数据到Excel文件
2014/06/12 PHP
PHP实现获取FLV文件的时间
2015/02/10 PHP
php实现将HTML页面转换成word并且保存的方法
2016/10/14 PHP
laravel通用化的CURD的实现
2019/12/13 PHP
JQuery UI的拖拽功能实现方法小结
2012/03/14 Javascript
node.js实现多图片上传实例
2014/06/03 Javascript
简单的JS时钟实例讲解
2016/01/13 Javascript
jQuery前端开发35个小技巧
2016/05/24 Javascript
js倒计时显示实例
2016/12/11 Javascript
微信小程序 转发功能的实现
2017/08/04 Javascript
js注册时输入合法性验证方法
2017/10/21 Javascript
如何为你的JavaScript代码日志着色详解
2019/04/08 Javascript
Python使用xlrd读取Excel格式文件的方法
2015/03/10 Python
Windows中安装使用Virtualenv来创建独立Python环境
2016/05/31 Python
浅析Python中的getattr(),setattr(),delattr(),hasattr()
2016/06/14 Python
一些常用的Python爬虫技巧汇总
2016/09/28 Python
Tensorflow使用tfrecord输入数据格式
2018/06/19 Python
Python实现统计英文文章词频的方法分析
2019/01/28 Python
用Python写一个模拟qq聊天小程序的代码实例
2019/03/06 Python
ZABBIX3.2使用python脚本实现监控报表的方法
2019/07/02 Python
Python 使用type来定义类的实现
2019/11/19 Python
Python datetime模块使用方法小结
2020/06/18 Python
Python3+RIDE+RobotFramework自动化测试框架搭建过程详解
2020/09/23 Python
利用CSS3的checked伪类实现OL的隐藏显示的方法
2010/12/18 HTML / CSS
css3实例教程 一款纯css3实现的发光屏幕旋转特效
2014/12/07 HTML / CSS
一些PHP的面试题
2015/05/06 面试题
Java基础类库面试题
2013/09/04 面试题
机械制造与自动化应届生求职信
2013/11/16 职场文书
入团者的自我评价分享
2013/12/02 职场文书
高一政治教学反思
2014/01/28 职场文书
党校学习党性分析材料
2014/12/19 职场文书
萤火虫之墓观后感
2015/06/05 职场文书
为什么MySQL分页用limit会越来越慢
2021/07/25 MySQL
MySQL数据库中的锁、解锁以及删除事务
2022/05/06 MySQL