Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python利用递归和walk()遍历目录文件的方法示例
Jul 14 Python
从头学Python之编写可执行的.py文件
Nov 28 Python
python批量替换多文件字符串问题详解
Apr 22 Python
python 不以科学计数法输出的方法
Jul 16 Python
Flask Web开发入门之文件上传(八)
Aug 17 Python
pthon贪吃蛇游戏详细代码
Jan 27 Python
详解tensorflow2.x版本无法调用gpu的一种解决方法
May 25 Python
django 实现后台从富文本提取纯文本
Jul 02 Python
python中np是做什么的
Jul 21 Python
Python实现一个优先级队列的方法
Jul 31 Python
python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)
Dec 03 Python
Python OpenCV超详细讲解读取图像视频和网络摄像头
Apr 02 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
php中var_export与var_dump的区别分析
2010/08/21 PHP
PHP下使用CURL方式POST数据至API接口的代码
2013/02/14 PHP
php实现购物车功能(以大苹果购物网为例)
2017/03/09 PHP
PHP实现的mysql操作类【MySQL与MySQLi方式】
2017/10/07 PHP
PHP检查URL包含特定字符串实例方法
2019/02/11 PHP
JavaScript 异步调用框架 (Part 5 - 链式实现)
2009/08/04 Javascript
JavaScript 学习笔记一些小技巧
2010/03/28 Javascript
javascript实现简单的页面右下角提示信息框
2015/07/31 Javascript
理解和运用JavaScript的闭包机制
2015/08/13 Javascript
jQuery实现最简单的切换图效果【可兼容IE6、火狐、谷歌、opera等】
2016/09/04 Javascript
JavaScript三种绑定事件方式及相互之间的区别分析
2017/01/10 Javascript
JavaScript控制输入框中只能输入中文、数字和英文的方法【基于正则实现】
2017/03/03 Javascript
jQuery插件FusionCharts实现的MSBar3D图效果示例【附demo源码】
2017/03/23 jQuery
ActiveX控件的使用-js实现打印超市小票功能代码详解
2017/11/22 Javascript
微信小程序实现给嵌套template模板传递数据的方式总结
2017/12/18 Javascript
浅谈Node.js 沙箱环境
2018/05/15 Javascript
基于vue cli 通过命令行传参实现多环境配置
2018/07/12 Javascript
vue实现手机端省市区区域选择
2019/09/27 Javascript
Layui数据表格之单元格编辑方式
2019/10/26 Javascript
编写Python脚本来实现最简单的FTP下载的教程
2015/05/04 Python
Python 中 Virtualenv 和 pip 的简单用法详解
2017/08/18 Python
Python基于回溯法子集树模板实现图的遍历功能示例
2017/09/05 Python
对Python中数组的几种使用方法总结
2018/06/28 Python
python+opencv实现摄像头调用的方法
2019/06/22 Python
python安装pil库方法及代码
2019/06/25 Python
pyqt5 QScrollArea设置在自定义侧(任何位置)
2019/09/25 Python
python使用SQLAlchemy操作MySQL
2020/01/02 Python
Django之全局使用request.user.username的实例详解
2020/05/14 Python
详解background属性的8个属性值(面试题)
2020/11/02 HTML / CSS
HTML5实现晶莹剔透的雨滴特效
2014/05/14 HTML / CSS
html2 canvas生成清晰的图片实现打印功能
2019/09/23 HTML / CSS
世界上最大的冷却器制造商:Igloo Coolers
2019/07/23 全球购物
用JAVA SOCKET编程,读服务器几个字符,再写入本地显示
2012/11/25 面试题
投标承诺书怎么写
2014/05/24 职场文书
Python自然语言处理之切分算法详解
2021/04/25 Python
win10怎么设置右下角图标不折叠?Win10设置右下角图标不折叠的方法
2022/07/15 数码科技