python 中文字符串的处理实现代码


Posted in Python onOctober 25, 2009

>>> teststr = '我的eclipse不能正确的解码gbk码!'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> tests2 = u'我的eclipse不能正确的解码gbk码!'
>>> test3 = tests2.encode('gb2312')
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8')
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8') == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.

Python 相关文章推荐
python实现简单socket通信的方法
Apr 19 Python
关于Django外键赋值问题详解
Aug 13 Python
python+matplotlib演示电偶极子实例代码
Jan 12 Python
tf.truncated_normal与tf.random_normal的详细用法
Mar 05 Python
linux安装python修改默认python版本方法
Mar 31 Python
python lxml中etree的简单应用
May 10 Python
对django 模型 unique together的示例讲解
Aug 06 Python
Python requests设置代理的方法步骤
Feb 23 Python
Python实现Canny及Hough算法代码实例解析
Aug 06 Python
Python extract及contains方法代码实例
Sep 11 Python
基于Python实现射击小游戏的制作
Apr 06 Python
Python 匹配文本并在其上一行追加文本
May 11 Python
动态创建类实例代码
Oct 07 #Python
Python 文件操作实现代码
Oct 07 #Python
Python 第一步 hello world
Sep 25 #Python
Python 字符串定义
Sep 25 #Python
Python 流程控制实例代码
Sep 25 #Python
Cython 三分钟入门教程
Sep 17 #Python
phpsir 开发 一个检测百度关键字网站排名的python 程序
Sep 17 #Python
You might like
解析如何在PHP下载文件名中解决乱码的问题
2013/06/20 PHP
帝国CMS留言板回复后发送EMAIL通知客户
2015/07/06 PHP
PHP下的浮点运算不准的解决方法
2016/10/27 PHP
PHP自动生成缩略图函数的源码示例
2019/03/18 PHP
Laravel统计一段时间间隔的数据方法
2019/10/09 PHP
laravel中数据显示方法(默认值和下拉option默认选中)
2019/10/11 PHP
PHP7移除的扩展和SAPI
2021/03/09 PHP
模拟电子签章盖章效果的jQuery插件源码
2013/06/24 Javascript
JS采用绝对定位实现回到顶部效果完整实例
2016/06/20 Javascript
值得分享的JavaScript实现图片轮播组件
2016/11/21 Javascript
谈谈为什么你的 JavaScript 代码如此冗长
2019/01/30 Javascript
Vue自定义指令结合阿里云OSS优化图片的实现方法
2019/11/12 Javascript
微信小程序修改数组长度的问题的解决
2019/12/17 Javascript
Vue实现跑马灯效果
2020/05/25 Javascript
vue项目打包后提交到git上为什么没有dist这个文件的解决方法
2020/09/16 Javascript
微信小程序开发数据缓存基础知识辨析及运用实例详解
2020/11/06 Javascript
详解Python3.1版本带来的核心变化
2015/04/07 Python
Django与JS交互的示例代码
2017/08/23 Python
Python多线程threading和multiprocessing模块实例解析
2018/01/29 Python
Ubuntu下使用Python实现游戏制作中的切分图片功能
2018/03/30 Python
pyqt5的QComboBox 使用模板的具体方法
2018/09/06 Python
Python3.4 splinter(模拟填写表单)使用方法
2018/10/13 Python
Tensorflow实现多GPU并行方式
2020/02/03 Python
Python使用pdb调试代码的技巧
2020/05/03 Python
Python-openpyxl表格读取写入的案例详解
2020/11/02 Python
HTML5 Canvas标签使用收录
2009/07/07 HTML / CSS
使用HTML5 Canvas API绘制弧线的教程
2016/03/22 HTML / CSS
Bloomingdale’s阿联酋:选购奢华时尚、美容及更多
2020/09/22 全球购物
数字化校园建设方案
2014/05/03 职场文书
个人违纪检讨书
2014/09/15 职场文书
乡镇党员群众路线教育实践活动对照检查材料思想汇报
2014/10/05 职场文书
2014年销售内勤工作总结
2014/12/01 职场文书
2015年爱国卫生工作总结
2015/04/22 职场文书
2015年实习班主任工作总结
2015/04/23 职场文书
机关单位保密工作责任书
2015/05/11 职场文书
消费者投诉书范文
2015/07/02 职场文书