python实现中文转换url编码的方法


Posted in Python onJune 14, 2016

本文实例讲述了python实现中文转换url编码的方法。分享给大家供大家参考,具体如下:

今天要处理百度贴吧的东西。想要做一个关键词的list,每次需要时,直接添加 到list里面就可以了。但是添加到list里面是中文的情况(比如‘丽江'),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。

>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'

那我们想转回去呢?

>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江

细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。

>>> import sys,urllib 
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python基于smtplib实现异步发送邮件服务
May 28 Python
Python简单实现TCP包发送十六进制数据的方法
Apr 16 Python
python版本坑:md5例子(python2与python3中md5区别)
Jun 20 Python
利用 python 对目录下的文件进行过滤删除
Dec 27 Python
彻底搞懂Python字符编码
Jan 23 Python
Python将字符串常量转化为变量方法总结
Mar 17 Python
python 扩展print打印文件路径和当前时间信息的实例代码
Oct 11 Python
python实现图片插入文字
Nov 26 Python
pytorch模型存储的2种实现方法
Feb 14 Python
Python分析最近大火的网剧《隐秘的角落》
Jul 02 Python
撤回我也能看到!教你用Python制作微信防撤回脚本
Jun 11 Python
Pytest中skip和skipif的具体使用方法
Jun 30 Python
Python的Django框架中消息通知的计数器实现教程
Jun 13 #Python
详解Python的Flask框架中的signals信号机制
Jun 13 #Python
Python的Flask站点中集成xhEditor文本编辑器的教程
Jun 13 #Python
Flask的图形化管理界面搭建框架Flask-Admin的使用教程
Jun 13 #Python
Python的Flask框架中集成CKeditor富文本编辑器的教程
Jun 13 #Python
Linux中安装Python的交互式解释器IPython的教程
Jun 13 #Python
浅谈python中的面向对象和类的基本语法
Jun 13 #Python
You might like
PHP的FTP学习(二)
2006/10/09 PHP
为查询结果建立向后/向前按钮
2006/10/09 PHP
PHP的switch判断语句的“高级”用法详解
2014/10/01 PHP
PHP递归获取目录内所有文件的实现方法
2016/11/01 PHP
Docker配置PHP开发环境教程
2016/12/21 PHP
万能的php分页类
2017/07/06 PHP
php原生数据库分页的代码实例
2019/02/18 PHP
PhpSpreadsheet设置单元格常用操作汇总
2020/11/13 PHP
JavaScript 拾碎[三] 使用className属性
2010/10/16 Javascript
jQuery选择器源码解读(七):elementMatcher函数
2015/03/31 Javascript
js通过iframe加载外部网页的实现代码
2015/04/05 Javascript
jQuery实现带渐显效果的人物多级关系图代码
2015/10/16 Javascript
JavaScript类型系统之正则表达式
2016/01/05 Javascript
js如何准确获取当前页面url网址信息
2020/09/13 Javascript
js 动态添加元素(div、li、img等)及设置属性的方法
2016/07/19 Javascript
微信和qq时间格式模板实例详解
2016/10/21 Javascript
纯js封装的ajax功能函数与用法示例
2018/05/14 Javascript
微信小程序仿抖音短视频切换效果的实例代码
2020/06/24 Javascript
python代码检查工具pylint 让你的python更规范
2012/09/05 Python
python通过字典dict判断指定键值是否存在的方法
2015/03/21 Python
使用url_helper简化Python中Django框架的url配置教程
2015/05/30 Python
Python爬虫库BeautifulSoup的介绍与简单使用实例
2020/01/25 Python
Python绘制动态水球图过程详解
2020/06/03 Python
StubHub德国:购买和出售门票
2017/09/06 全球购物
欧洲最大的球衣网上商店:Kitbag
2017/11/11 全球购物
MADE法国:提供原创设计师家具
2018/09/18 全球购物
Theo + George官方网站:都柏林时尚品牌
2019/04/08 全球购物
英国发展最快的在线超市之一:Click Marketplace
2021/02/15 全球购物
How TDD works
2012/09/30 面试题
30年同学聚会感言
2014/01/30 职场文书
超市开店计划书
2014/09/15 职场文书
财务工作失职检讨书
2014/11/21 职场文书
出国留学单位推荐信
2015/03/26 职场文书
2015年中学总务处工作总结
2015/07/22 职场文书
2016年过年放假安排通知
2015/08/18 职场文书
Go语言使用select{}阻塞main函数介绍
2021/04/25 Golang