python BeautifulSoup设置页面编码的方法


Posted in Python onApril 03, 2015

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

  

print soup.originalEncoding

print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
Python 相关文章推荐
python通过yield实现数组全排列的方法
Mar 18 Python
在Python中操作字典之setdefault()方法的使用
May 21 Python
python学习之面向对象【入门初级篇】
Jan 21 Python
http请求 request失败自动重新尝试代码示例
Jan 25 Python
Python selenium实现微博自动登录的示例代码
May 16 Python
Django 忘记管理员或忘记管理员密码 重设登录密码的方法
May 30 Python
Python中staticmethod和classmethod的作用与区别
Oct 11 Python
python实现微信防撤回神器
Apr 29 Python
python 实现按对象传值
Dec 26 Python
Python 批量读取文件中指定字符的实现
Mar 06 Python
浅谈Python里面None True False之间的区别
Jul 09 Python
Python3 如何开启自带http服务
May 18 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 #Python
用Python中的__slots__缓存资源以节省内存开销的方法
Apr 02 #Python
用Python的线程来解决生产者消费问题的示例
Apr 02 #Python
用实例分析Python中method的参数传递过程
Apr 02 #Python
使用优化器来提升Python程序的执行效率的教程
Apr 02 #Python
使用Python脚本对Linux服务器进行监控的教程
Apr 02 #Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
You might like
php下使用SMTP发邮件的代码
2008/01/10 PHP
php下利用curl判断远程文件是否存在的实现代码
2011/10/08 PHP
PHP连接SQLServer2005方法及代码
2013/12/26 PHP
PHP使用CURL_MULTI实现多线程采集的例子
2014/07/29 PHP
PHP导出Excel实例讲解
2016/01/24 PHP
PHP简单获取随机数的常用方法小结
2017/06/07 PHP
Hutia 的 JS 代码集
2006/10/24 Javascript
文本框的字数限制功能jquery插件
2009/11/24 Javascript
js getBoundingClientRect() 来获取页面元素的位置
2010/11/25 Javascript
jquery.tableSort.js表格排序插件使用方法详解
2020/08/12 Javascript
javascript 日期相减-在线教程(附代码)
2017/08/17 Javascript
详解如何去除vue项目中的#——History模式
2017/10/13 Javascript
vue实现商城购物车功能
2017/11/27 Javascript
Vue Element使用icon图标教程详解(第三方)
2018/02/07 Javascript
js canvas实现二维码和图片合成的海报
2020/11/19 Javascript
javascript判断一个变量是数组还是对象
2019/04/10 Javascript
在vue中获取wangeditor的html和text的操作
2020/10/23 Javascript
ESLint 是如何检查 .vue 文件的
2020/11/30 Vue.js
Python列表计数及插入实例
2014/12/17 Python
Python中每次处理一个字符的5种方法
2015/05/21 Python
如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
2015/10/13 Python
python GUI库图形界面开发之pyinstaller打包python程序为exe安装文件
2020/02/26 Python
python文件排序的方法总结
2020/09/13 Python
python3爬虫GIL修改多线程实例讲解
2020/11/24 Python
Python 求向量的余弦值操作
2021/03/04 Python
CSS3绘制有活力的链接下划线
2016/07/14 HTML / CSS
数据库的约束含义
2012/09/09 面试题
群众路线领导对照材料
2014/08/23 职场文书
教育局党的群众路线教育实践活动整改方案
2014/09/20 职场文书
乡镇三严三实学习心得体会
2014/10/13 职场文书
扬州个园导游词
2015/02/06 职场文书
小学大队长竞选稿
2015/11/20 职场文书
自愿离婚协议书范本2016
2016/03/18 职场文书
人身损害赔偿协议书
2016/03/22 职场文书
python实现调用摄像头并拍照发邮箱
2021/04/27 Python
nginx部署多前端项目的几种方法
2021/05/25 Servers