Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
wxPython窗口中文乱码解决方法
Oct 11 Python
利用Python实现Windows定时关机功能
Mar 21 Python
详解Python 模拟实现生产者消费者模式的实例
Aug 10 Python
Python正确重载运算符的方法示例详解
Aug 27 Python
Python内建模块struct实例详解
Feb 02 Python
解决安装python3.7.4报错Can''t connect to HTTPS URL because the SSL module is not available
Jul 31 Python
深入浅析Python 命令行模块 Click
Mar 11 Python
关于python 的legend图例,参数使用说明
Apr 17 Python
200行python代码实现贪吃蛇游戏
Apr 24 Python
python如何使用代码运行助手
Jul 03 Python
浅析Python 序列化与反序列化
Aug 05 Python
Pycharm编辑器功能之代码折叠效果的实现代码
Oct 15 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
ci检测是ajax还是页面post提交数据的方法
2014/11/10 PHP
php 参数过滤、数据过滤详解
2015/10/26 PHP
理解JavaScript的caller,callee,call,apply
2009/04/28 Javascript
分享一道笔试题[有n个直线最多可以把一个平面分成多少个部分]
2012/10/12 Javascript
HTTP 304错误的详细讲解
2013/11/13 Javascript
js 日期比较相关天数代码
2014/04/02 Javascript
jQuery判断数组是否包含了指定的元素
2015/03/10 Javascript
学习JavaScript编程语言的8张思维导图分享
2015/03/27 Javascript
AngularJS的表单使用详解
2015/06/17 Javascript
javascript实现框架高度随内容改变的方法
2015/07/23 Javascript
jQuery的框架介绍
2016/05/11 Javascript
基于BootStrap Metronic开发框架经验小结【九】实现Web页面内容的打印预览和保存操作
2016/05/12 Javascript
BootStrap的table表头固定tbody滚动的实例代码
2016/08/24 Javascript
js实现延迟加载的几种方法
2017/04/24 Javascript
js实现数字递增特效【仿支付宝我的财富】
2017/05/05 Javascript
详解express + mock让前后台并行开发
2018/06/06 Javascript
浅谈JavaScript 代码简洁之道
2019/01/09 Javascript
vue中在vuex的actions中请求数据实例
2019/11/08 Javascript
python del()函数用法
2013/03/24 Python
跟老齐学Python之深入变量和引用对象
2014/09/24 Python
Python实现获取照片拍摄日期并重命名的方法
2017/09/30 Python
Python编程实现二分法和牛顿迭代法求平方根代码
2017/12/04 Python
python书籍信息爬虫实例
2018/03/19 Python
Python 多线程不加锁分块读取文件的方法
2018/12/11 Python
python字典一键多值实例代码分享
2019/06/14 Python
Python 实现文件读写、坐标寻址、查找替换功能
2019/09/11 Python
TensorFlow Saver:保存和读取模型参数.ckpt实例
2020/02/10 Python
python实现替换word中的关键文字(使用通配符)
2020/02/13 Python
详解Windows下PyCharm安装Numpy包及无法安装问题解决方案
2020/06/18 Python
如何利用python读取micaps文件详解
2020/10/18 Python
html5 div布局与table布局详解
2016/11/16 HTML / CSS
div或img图片高度随宽度自适应的方法
2020/02/06 HTML / CSS
opencv实现图像几何变换
2021/03/24 Python
市场营销毕业生自荐信
2013/11/23 职场文书
医院见习总结
2015/06/24 职场文书
日本十大血腥动漫,那些被禁播的动漫盘点
2022/03/21 日漫