Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python操作sqlite3快速、安全插入数据(防注入)的实例
Apr 26 Python
matplotlib设置legend图例代码示例
Dec 19 Python
运用TensorFlow进行简单实现线性回归、梯度下降示例
Mar 05 Python
Python Xml文件添加字节属性的方法
Mar 31 Python
Python中list查询及所需时间计算操作示例
Jun 21 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
Python SMTP发送邮件遇到的一些问题及解决办法
Oct 24 Python
Python面向对象之类的内置attr属性示例
Dec 14 Python
python实现计数排序与桶排序实例代码
Mar 28 Python
Python-jenkins模块之folder相关操作介绍
May 12 Python
解决keras,val_categorical_accuracy:,0.0000e+00问题
Jul 02 Python
Pytorch框架实现mnist手写库识别(与tensorflow对比)
Jul 20 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
PHP的FTP学习(三)
2006/10/09 PHP
成为好程序员必须避免的5个坏习惯
2014/07/04 PHP
php去除字符串中空字符的常用方法小结
2015/03/17 PHP
php制作圆形用户头像的实例_自定义封装类源代码
2017/09/18 PHP
php进行md5加密简单实例方法
2019/09/19 PHP
PHP dirname功能及原理实例解析
2020/10/28 PHP
List Installed Software Features
2007/06/11 Javascript
JavaScript面向对象(极简主义法minimalist approach)
2012/07/17 Javascript
js借助ActiveXObject实现创建文件
2013/09/29 Javascript
JavaScript中的公有、私有、特权和静态成员用法分析
2014/11/20 Javascript
JavaScript中的toUTCString()方法使用详解
2015/06/12 Javascript
js实现简单的省市县三级联动效果实例
2016/02/18 Javascript
jquery对Json的各种遍历方法总结(必看篇)
2016/09/29 Javascript
详解微信小程序开发之下拉刷新 上拉加载
2016/11/24 Javascript
AngularJS的依赖注入实例分析(使用module和injector)
2017/01/19 Javascript
JS实现下拉菜单列表与登录注册弹窗效果
2017/08/10 Javascript
详解vue填坑之解决部分浏览器不支持pushState方法
2018/07/12 Javascript
Vue+Element UI+Lumen实现通用表格分页功能
2019/02/02 Javascript
vue.js+elementUI实现点击左右箭头切换头像功能(类似轮播图效果)
2019/09/05 Javascript
JavaScript运动原理基础知识详解
2020/04/02 Javascript
jQuery 动态粒子效果示例代码
2020/07/07 jQuery
vue实现井字棋游戏
2020/09/29 Javascript
python获取文件版本信息、公司名和产品名的方法
2014/10/05 Python
Python压缩和解压缩zip文件
2015/02/14 Python
python模块之re正则表达式详解
2017/02/03 Python
Python中%是什么意思?python中百分号如何使用?
2018/03/20 Python
小结Python的反射机制
2020/09/28 Python
python破解同事的压缩包密码
2020/10/14 Python
一些PHP的面试题
2015/05/06 面试题
母亲节演讲稿范文
2014/01/02 职场文书
老师的检讨书
2014/02/23 职场文书
2014学校庆三八妇女节活动总结
2014/03/01 职场文书
初一军训感言
2015/08/01 职场文书
Python趣味挑战之给幼儿园弟弟生成1000道算术题
2021/05/28 Python
使用 Apache Dubbo 实现远程通信(微服务架构)
2022/02/12 Servers
node快速搭建后台的实现步骤
2022/02/18 NodeJs