python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
python使用paramiko实现远程拷贝文件的方法
Apr 18 Python
Python max内置函数详细介绍
Nov 17 Python
Python基于正则表达式实现检查文件内容的方法【文件检索】
Aug 30 Python
用python与文件进行交互的方法
Mar 01 Python
python线程池threadpool实现篇
Apr 27 Python
python切片及sys.argv[]用法详解
May 25 Python
pycharm远程linux开发和调试代码的方法
Jul 17 Python
Python循环实现n的全排列功能
Sep 16 Python
Python tkinter模版代码实例
Feb 05 Python
Python可以实现栈的结构吗
May 27 Python
基于python实现模拟数据结构模型
Jun 12 Python
opencv 图像礼帽和图像黑帽的实现
Jul 07 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
php google或baidu分页代码
2009/11/26 PHP
分享自定义的几个PHP功能函数
2015/04/15 PHP
深入理解php printf() 输出格式化的字符串
2016/05/23 PHP
laravel中短信发送验证码的实现方法
2018/04/25 PHP
PHP使用curl_multi_select解决curl_multi网页假死问题的方法
2018/08/15 PHP
extjs 学习笔记(三) 最基本的grid
2009/10/15 Javascript
基于jquery的button默认enter事件(回车事件)。
2011/05/18 Javascript
jQuery ajax调用后台aspx后台文件的两种常见方法(不是ashx)
2016/06/28 Javascript
ReactNative页面跳转实例代码
2016/09/27 Javascript
JavaScript将base64图片转换成formData并通过AJAX提交的实现方法
2016/10/24 Javascript
关于Node.js中Buffer的一些你可能不知道的用法
2017/03/28 Javascript
bootstrap table sum总数量统计实现方法
2017/10/29 Javascript
NodeJS读取分析Nginx错误日志的方法
2019/05/14 NodeJs
浅谈redux, koa, express 中间件实现对比解析
2019/05/23 Javascript
Element实现表格分页数据选择+全选所有完善批量操作
2019/06/07 Javascript
Vue 3.x+axios跨域方案的踩坑指南
2019/07/04 Javascript
[04:27]2014DOTA2国际邀请赛 NAVI战队官方纪录片
2014/07/21 DOTA
Python通过90行代码搭建一个音乐搜索工具
2015/07/29 Python
Python实现获取本地及远程图片大小的方法示例
2018/07/21 Python
Python可变和不可变、类的私有属性实例分析
2019/05/31 Python
手把手教你进行Python虚拟环境配置教程
2020/02/03 Python
通过实例解析Python return运行原理
2020/03/04 Python
python多进程下的生产者和消费者模型
2020/05/07 Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
2020/06/02 Python
简单了解Python字典copy与赋值的区别
2020/09/16 Python
中学生打架检讨书
2014/02/10 职场文书
健康教育评估方案
2014/05/25 职场文书
司机岗位职责说明书
2014/07/29 职场文书
生产工厂门卫岗位职责
2014/09/26 职场文书
教师批评与自我批评
2014/10/15 职场文书
2014年导购员工作总结
2014/11/18 职场文书
技术入股合作协议书
2016/03/21 职场文书
导游词之海南-南湾猴岛
2019/10/12 职场文书
Golang原生rpc(rpc服务端源码解读)
2022/04/07 Golang
Spring Data JPA框架持久化存储数据到数据库
2022/04/28 Java/Android
MySQL脏读,幻读和不可重复读
2022/05/11 MySQL