python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python CSV模块使用实例
Apr 09 Python
Python实现将json文件中向量写入Excel的方法
Mar 26 Python
Python简单实现网页内容抓取功能示例
Jun 07 Python
django多种支付、并发订单处理实例代码
Dec 13 Python
TensorFlow梯度求解tf.gradients实例
Feb 04 Python
python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解
Feb 11 Python
python实现输入三角形边长自动作图求面积案例
Apr 12 Python
Django ORM filter() 的运用详解
May 14 Python
django 数据库 get_or_create函数返回值是tuple的问题
May 15 Python
使用python实现下载我们想听的歌曲,速度超快
Jul 09 Python
pdf论文中python画的图Type 3 fonts字体不兼容的解决方案
Apr 24 Python
python套接字socket通信
Apr 01 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
PHP5 安装方法
2006/10/09 PHP
PHP Laravel 上传图片、文件等类封装
2017/08/16 PHP
常用js脚本
2006/12/03 Javascript
jQuery判断iframe中元素是否存在的方法
2013/05/11 Javascript
Javascript自定义函数判断网站访问类型是PC还是移动终端
2014/01/10 Javascript
jQuery中bind(),live(),delegate(),on()绑定事件方法实例详解
2016/01/19 Javascript
利用jQuery设计一个简单的web音乐播放器的实例分享
2016/03/08 Javascript
jQuery多级联动下拉插件chained用法示例
2016/08/20 Javascript
JavaScript判断浏览器和hack滚动条的写法
2017/07/23 Javascript
解决bootstrap-select 动态加载数据不显示的问题
2018/08/10 Javascript
JS实现网站吸顶条
2020/01/08 Javascript
python文件和目录操作函数小结
2014/07/11 Python
python使用正则表达式替换匹配成功的组
2017/11/17 Python
python模块常用用法实例详解
2019/10/17 Python
解决Pytorch 加载训练好的模型 遇到的error问题
2020/01/10 Python
python3排序的实例方法
2020/10/20 Python
法国最大的在线眼镜店:EasyLunettes
2019/08/26 全球购物
Simons官方网站:加拿大时尚零售商
2020/02/20 全球购物
Pandora西班牙官方商店:PandoraShop.es
2020/10/05 全球购物
医学生自荐信范文
2013/12/03 职场文书
行政专员岗位职责
2014/01/02 职场文书
公司活动方案范文
2014/03/06 职场文书
幼儿园中班教师寄语
2014/04/03 职场文书
爬山的活动方案
2014/08/16 职场文书
计生办班子群众路线教育实践活动个人对照检查材料思想汇报
2014/10/04 职场文书
2014年信访工作总结
2014/11/17 职场文书
2015年个人现实表现材料
2014/12/10 职场文书
2015年入党积极分子评语
2015/03/26 职场文书
特此通知格式
2015/04/27 职场文书
慈善献爱心倡议书
2015/04/27 职场文书
2015秋季幼儿园开学通知
2015/07/16 职场文书
干部作风纪律整顿心得体会
2016/01/23 职场文书
《司马光》教学反思
2016/02/22 职场文书
如何制作自己的原生JavaScript路由
2021/05/05 Javascript
python Django框架快速入门教程(后台管理)
2021/07/21 Python
idea下配置tomcat避坑详解
2022/04/12 Servers