python BeautifulSoup设置页面编码的方法


Posted in Python onApril 03, 2015

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

  

print soup.originalEncoding

print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
Python 相关文章推荐
使用Python的Zato发送AMQP消息的教程
Apr 16 Python
pyenv命令管理多个Python版本
Mar 26 Python
Django 内置权限扩展案例详解
Mar 04 Python
Python使用sklearn实现的各种回归算法示例
Jul 04 Python
django之状态保持-使用redis存储session的例子
Jul 28 Python
在Pytorch中使用样本权重(sample_weight)的正确方法
Aug 17 Python
python+Django实现防止SQL注入的办法
Oct 31 Python
python实现简单日志记录库glog的使用
Dec 13 Python
通过实例解析python描述符原理作用
Jan 22 Python
Python3读取和写入excel表格数据的示例代码
Jun 09 Python
python自动化发送邮件实例讲解
Jan 04 Python
教你用Python+selenium搭建自动化测试环境
Jun 18 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 #Python
用Python中的__slots__缓存资源以节省内存开销的方法
Apr 02 #Python
用Python的线程来解决生产者消费问题的示例
Apr 02 #Python
用实例分析Python中method的参数传递过程
Apr 02 #Python
使用优化器来提升Python程序的执行效率的教程
Apr 02 #Python
使用Python脚本对Linux服务器进行监控的教程
Apr 02 #Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
You might like
php中使用临时表查询数据的一个例子
2013/02/03 PHP
ueditor 1.2.6 使用方法说明
2013/07/24 PHP
PHP+jquery+ajax实现即时聊天功能实例
2014/12/23 PHP
php开发工具有哪五款
2015/11/09 PHP
ThinkPHP模板循环输出Volist标签用法实例详解
2016/03/23 PHP
phpstorm最新激活码分享亲测phpstorm2020.2.3版可用
2020/11/22 PHP
自动检查并替换文本框内的字符
2006/06/30 Javascript
bcastr2.0 通用的图片浏览器
2006/11/22 Javascript
javascript replace方法与正则表达式
2008/02/19 Javascript
js给dropdownlist添加选项的小例子
2013/03/04 Javascript
JavaScript关闭当前页面(窗口)不带任何提示
2014/03/26 Javascript
Javascript常用小技巧汇总
2015/06/24 Javascript
JavaScript中定义对象原型的两种使用方法
2016/12/15 Javascript
JS排序算法之希尔排序与快速排序实现方法
2017/12/12 Javascript
vue 开发一个按钮组件的示例代码
2018/03/27 Javascript
vue实现从外部修改组件内部的变量的值
2020/07/30 Javascript
Python Tkinter简单布局实例教程
2014/09/03 Python
linux 下实现python多版本安装实践
2014/11/18 Python
Python使用multiprocessing实现一个最简单的分布式作业调度系统
2016/03/14 Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
2017/11/29 Python
Python将DataFrame的某一列作为index的方法
2018/04/08 Python
python 字符串和整数的转换方法
2018/06/25 Python
python cs架构实现简单文件传输
2020/03/20 Python
Python自定义一个类实现字典dict功能的方法
2019/01/19 Python
python使用wxpy实现微信消息防撤回脚本
2019/04/29 Python
安装好Pycharm后如何配置Python解释器简易教程
2019/06/28 Python
python如何删除文件中重复的字段
2019/07/16 Python
详解Django定时任务模块设计与实践
2019/07/24 Python
解决Django中修改js css文件但浏览器无法及时与之改变的问题
2019/08/31 Python
pytorch加载自己的图像数据集实例
2020/07/07 Python
Python制作简单的剪刀石头布游戏
2020/12/10 Python
HTML5中视频音频的使用详解
2017/07/07 HTML / CSS
表彰大会主持词
2014/03/26 职场文书
民事和解协议书格式
2014/11/29 职场文书
2016计划生育先进个人事迹材料
2016/02/29 职场文书
php将xml转化对象的实例详解
2021/11/17 PHP