Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
wxPython中文教程入门实例
Jun 09 Python
python爬虫框架scrapy实战之爬取京东商城进阶篇
Apr 24 Python
Python 多维List创建的问题小结
Jan 18 Python
numpy下的flatten()函数用法详解
May 27 Python
Python的垃圾回收机制详解
Aug 28 Python
python如何提取英语pdf内容并翻译
Mar 03 Python
python自动脚本的pyautogui入门学习
Apr 01 Python
Python使用socketServer包搭建简易服务器过程详解
Jun 12 Python
python 读取.nii格式图像实例
Jul 01 Python
python操作redis数据库的三种方法
Sep 10 Python
python实现简易名片管理系统
Apr 11 Python
python区块链实现简版工作量证明
May 25 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
Thinkphp模板中截取字符串函数简介
2014/06/17 PHP
3款值得推荐的微信开发开源框架
2014/10/28 PHP
Symfony生成二维码的方法
2016/02/04 PHP
PHP与Web页面的交互示例详解一
2020/08/04 PHP
jQuery Ajax文件上传(php)
2009/06/16 Javascript
JavaScript使用IEEE 标准进行二进制浮点运算产生莫名错误的解决方法
2011/05/28 Javascript
JS实现图片预加载无需等待
2012/12/21 Javascript
JS获取屏幕,浏览器窗口大小,网页高度宽度(实现代码)
2013/12/17 Javascript
Javascript封装DOMContentLoaded事件实例
2014/06/12 Javascript
jQuery实现在下拉列表选择时获取json数据的方法
2015/04/16 Javascript
理解javascript定时器中的单线程
2016/02/23 Javascript
js动态添加的DIV中的onclick事件简单实例
2016/07/25 Javascript
Nodejs下用submit提交表单提示cannot post错误的解决方法
2016/11/21 NodeJs
js实现图片360度旋转
2017/01/22 Javascript
解决nodejs中使用http请求返回值为html时乱码的问题
2017/02/18 NodeJs
JavaScript中使用import 和require打包后实现原理分析
2018/03/07 Javascript
Vue.js实现的表格增加删除demo示例
2018/05/22 Javascript
在vue中使用Autoprefixed的方法
2018/07/27 Javascript
python使用beautifulsoup从爱奇艺网抓取视频播放
2014/01/23 Python
tornado捕获和处理404错误的方法
2014/02/26 Python
python实现查找excel里某一列重复数据并且剔除后打印的方法
2015/05/26 Python
python画柱状图--不同颜色并显示数值的方法
2018/12/13 Python
谈谈Python中的while循环语句
2019/03/10 Python
详细介绍pandas的DataFrame的append方法使用
2019/07/31 Python
python scatter函数用法实例详解
2020/02/11 Python
Python视频编辑库MoviePy的使用
2020/04/01 Python
python继承threading.Thread实现有返回值的子类实例
2020/05/02 Python
pandas dataframe 中的explode函数用法详解
2020/05/18 Python
Python预测2020高考分数和录取情况
2020/07/08 Python
python在协程中增加任务实例操作
2021/02/28 Python
基于HTML5超酷摄像头(HTML5 webcam)拍照功能实现代码
2012/12/13 HTML / CSS
波兰灯具、照明和LED购物网站:Lampy.pl
2019/03/11 全球购物
销售经理工作职责
2014/02/03 职场文书
升旗仪式主持词
2014/03/19 职场文书
篮球社团活动总结
2014/06/27 职场文书
毕业论文指导老师意见
2015/06/04 职场文书