Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python基础教程之Filter使用方法
Jan 17 Python
python 生成器协程运算实例
Sep 04 Python
Python中列表list以及list与数组array的相互转换实现方法
Sep 22 Python
Django项目中包含多个应用时对url的配置方法
May 30 Python
pandas读取csv文件,分隔符参数sep的实例
Dec 12 Python
python 定时器,实现每天凌晨3点执行的方法
Feb 20 Python
django实现支付宝支付实例讲解
Oct 17 Python
妙用itchat! python实现久坐提醒功能
Nov 25 Python
python中的数组赋值与拷贝的区别详解
Nov 26 Python
在pycharm中实现删除bookmark
Feb 14 Python
Pycharm连接远程服务器过程图解
Apr 30 Python
python之django路由和视图案例教程
Jul 26 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
php获得当前的脚本网址
2007/12/10 PHP
PHP Memcached应用实现代码
2010/02/08 PHP
php+ajax+json 详解及实例代码
2016/12/12 PHP
PHP读取XML格式文件的方法总结
2017/02/27 PHP
PHP基于redis计数器类定义与用法示例
2018/02/08 PHP
laravel利用中间件防止未登录用户直接访问后台的方法
2019/09/30 PHP
PHP实现笛卡尔积算法的实例讲解
2019/12/22 PHP
javascript一个无懈可击的实例化XMLHttpRequest的方法
2010/10/13 Javascript
最短的IE判断代码
2011/03/13 Javascript
开发插件的两个方法jquery.fn.extend与jquery.extend
2013/11/21 Javascript
JS、jquery实现几分钟前、几小时前、几天前等时间差显示效果的代码实例分享
2014/04/11 Javascript
jQuery+ajax中getJSON() 用法实例
2014/12/22 Javascript
JavaScript使用Math.Min返回两个数中较小数的方法
2015/04/06 Javascript
JS实现合并两个数组并去除重复项只留一个的方法
2015/12/17 Javascript
js 调用百度分享功能
2017/02/27 Javascript
浅谈Angular2 ng-content 指令在组件中嵌入内容
2017/08/18 Javascript
通过封装scroll.js 获取滚动条的值
2018/07/13 Javascript
vue组件定义,全局、局部组件,配合模板及动态组件功能示例
2019/03/19 Javascript
Vue CL3 配置路径别名详解
2019/05/30 Javascript
基于Vue+Webpack拆分路由文件实现管理
2020/11/16 Javascript
详解React中共享组件逻辑的三种方式
2021/02/02 Javascript
python写的一个文本编辑器
2014/01/23 Python
python Tcp协议发送和接收信息的例子
2019/07/22 Python
HTML的form表单和django的form表单
2019/07/25 Python
pytorch中的transforms模块实例详解
2019/12/31 Python
解决python3插入mysql时内容带有引号的问题
2020/03/02 Python
python matplotlib包图像配色方案分享
2020/03/14 Python
农行实习自我鉴定
2013/09/22 职场文书
商场端午节活动方案
2014/01/29 职场文书
《落花生》教学反思
2014/02/25 职场文书
法律顾问服务方案
2014/05/15 职场文书
2014年教师学期工作总结
2014/11/08 职场文书
餐饮食品安全责任书
2015/01/29 职场文书
元旦联欢晚会主持词
2015/07/01 职场文书
推荐六本经典文学奖书籍:此生必读
2019/08/22 职场文书
Python绘制散乱的点构成的图的方法
2022/04/21 Python