Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python删除指定目录下过期文件的2个脚本分享
Apr 10 Python
Python如何判断数独是否合法
Sep 08 Python
Python设计模式之观察者模式简单示例
Jan 10 Python
python 处理数字,把大于上限的数字置零实现方法
Jan 28 Python
python从子线程中获得返回值的方法
Jan 30 Python
详解python中的线程与线程池
May 10 Python
python SQLAlchemy的Mapping与Declarative详解
Jul 04 Python
Python 日期区间处理 (本周本月上周上月...)
Aug 08 Python
在flask中使用python-dotenv+flask-cli自定义命令(推荐)
Jan 05 Python
python实现感知机模型的示例
Sep 30 Python
python中的None与NULL用法说明
May 25 Python
python开发的自动化运维工具ansible详解
Aug 07 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
支持数组的ADDSLASHES的php函数
2010/02/16 PHP
使用php-timeit估计php函数的执行时间
2015/09/06 PHP
PHP使用反射机制实现查找类和方法的所在位置
2016/04/22 PHP
PHP中用mysqli面向对象打开连接关闭mysql数据库的方法
2016/11/05 PHP
关于php开启错误提示的总结
2019/09/24 PHP
Prototype Class对象学习
2009/07/19 Javascript
最佳JS代码编写的14条技巧
2011/01/09 Javascript
JS异常处理的一个想法(sofish)
2013/03/14 Javascript
使用js声明数组,对象在jsp页面中(获得ajax得到json数据)
2013/11/05 Javascript
jquery缓动swing liner控制动画过程不同时刻的速度
2014/05/29 Javascript
原生JavaScript生成GUID的实现示例
2014/09/05 Javascript
JavaScript中的对象序列化介绍
2014/12/30 Javascript
js实现数组冒泡排序、快速排序原理
2016/03/08 Javascript
深入解析桶排序算法及Node.js上JavaScript的代码实现
2016/07/06 Javascript
Angular ng-class详解及实例代码
2016/09/19 Javascript
jQuery实现点击任意位置弹出层外关闭弹出层效果
2016/10/19 Javascript
vue如何从接口请求数据
2017/06/22 Javascript
Vue常用指令详解分析
2018/08/19 Javascript
微信小程序之下拉列表实现方法解析(附完整源码)
2019/08/23 Javascript
vue学习笔记之过滤器的基本使用方法实例分析
2020/02/01 Javascript
webpack安装配置与常见使用过程详解(结合vue)
2020/06/01 Javascript
Python pandas常用函数详解
2018/02/07 Python
python实现Dijkstra静态寻路算法
2019/01/17 Python
详解python爬虫系列之初识爬虫
2019/04/06 Python
libreoffice python 操作word及excel文档的方法
2019/07/04 Python
Python-openCV读RGB通道图实例
2020/01/17 Python
django queryset 去重 .distinct()说明
2020/05/19 Python
virtualenv介绍及简明教程
2020/06/23 Python
在终端启动Python时报错的解决方案
2020/11/20 Python
硕士研究生自我鉴定
2013/11/08 职场文书
社会公德演讲稿
2014/05/20 职场文书
旷工检讨书1000字
2015/01/01 职场文书
奖励申请报告范文
2015/05/15 职场文书
Python机器学习算法之决策树算法的实现与优缺点
2021/05/13 Python
Python List remove()实例用法详解
2021/08/02 Python
十大冰系宝可梦排名,颜值最高的阿罗拉九尾,第三使用率第一
2022/03/18 日漫