五种Python转义表示法


Posted in Python onNovember 27, 2020

1. 为什么要有转义?

ASCII 表中一共有 128 个字符。这里面有我们非常熟悉的字母、数字、标点符号,这些都可以从我们的键盘中输出。除此之外,还有一些非常特殊的字符,这些字符,我通常很难用键盘上的找到,比如制表符、响铃这种。

为了能将那些特殊字符都能写入到字符串变量中,就规定了一个用于转义的字符 \ ,有了这个字符,你在字符串中看的字符,print 出来后就不一定你原来看到的了。

举个例子

>>> msg = "hello\013world\013hello\013python"
>>> print(msg)
hello
   world
     hello
        python
>>>

是不是有点神奇?变成阶梯状的输出了。

那个 \013 又是什么意思呢?

  • \ 是转义符号,上面已经说过
  • 013 是 ASCII 编码的八进制表示,注意前面是 0 且不可省略,而不是字母 o

把八进制的 13 转成 10 进制后是 11

五种Python转义表示法

对照查看 ASCII 码表,11 对应的是一个垂直定位符号,这就能解释,为什么是阶梯状的输出字符串。

五种Python转义表示法

2. 转义的 5 种表示法

ASCII 有 128 个字符,如果用 八进制表示,至少得有三位数,才能将其全部表示。这就是为什么说上面的首位 0 不能省略的原因,即使现在用不上,我也得把它空出来。

而如果使用十六进制,只要两位数就其 ASCII 的字符全部表示出来。同时为了避免和八进制的混淆起来,所以在 \ 后面要加上英文字母 x 表示十六进制,后面再接两位十六进制的数值。

  • \ 开头并接三位 0-7 的数值,表示 8 进制
  • \x 开头并接两位 0-f 的数值,表示 16进制

因此,当我定义一个字符串的值为 hello + 回车 + world 时,就有了多种方法:

# 第一种方法:8进制
>>> msg = "hello\012world"
>>> print(msg)
hello
world
>>> 

# 第二种方法:16 进制
>>> msg = "hello\x0aworld"
>>> print(msg)
hello
world
>>>

通常我们很难记得住一个字符的 ASCII 编号,即使真记住了,也要去转换成八进制或者16进制,实在是太难了。

因此对于一些常用并且比较特殊字符,我们习惯用另一种类似别名的方式,比如使用 \n 表示换行,它与 \012\x0a 是等价的。

与此类似的表示法,还有如下这些

五种Python转义表示法

于是,要实现 hello + 回车 + world ,就有了第三种方法

# 第三种方法:使用类似别名的方法
>>> msg = "hello\nworld"
>>> print(msg)
hello
world
>>>

到目前为止,我们掌握了 三种转义的表示法。

已经非常难得了,让我们的脑洞再大一点吧,接下来再介绍两种。

ASCII 码表所能表示字符实在太有限了,想打印一个中文汉字,抱歉,你得借助 Unicode 码。

Unicode 编码由 4 个16进制数值组合而成

>>> print("\u4E2D")
中

什么?我为什么知道 的 unicode 是 \u4E2D?像下面这样打印就知道啦

# Python 2.7
>>> a = u"中"
>>> a
u'\u4e2d'

由此,要实现 hello + 回车 + world ,就有了第四种方法。

# 第四种方法:使用 unicode ,\u000a 表示换行
>>> print('hello\u000aworld')
hello
world

看到这里,你是不是以为要结束啦?

不,还没有。下面还有一种。

Unicode 编码其实还可以由 8 个32进制数值组合而成,为了以前面的区分开来,这里用 \U 开头。

# 第五种方法:使用 unicode ,\U0000000A 表示换行
>>> print('hello\U0000000Aworld')
hello
world

好啦,目前我们掌握了五种转义的表示法。

总结一下:

  • \ 开头并接三位 0-7 的数值(八进制) — 可以表示所有ASCII 字符
  • \x 开头并接两位 0-f 的数值(十六进制) — 可以表示所有ASCII 字符
  • \u 开头并接四位 0-f 的数值(十六进制) — 可以表示所有 Unicode 字符
  • \U 开头并接八位 0-f 的数值(三十二进制)) — 可以表示所有 Unicode 字符
  • \ 开头后接除 x、u、U 之外的特定字符 — 仅可表示部分字符

为什么标题说,转义也可以炫技呢?

试想一下,假如你的同事,在打印日志时,使用这种 unicode 编码,然后你在定位问题的时候使用这个关键词去搜,却发现什么都搜不到?这就扑街了。

五种Python转义表示法

虽然这种行为真的很 sb,但在某些人看来也许是非常牛逼的操作呢?

五种转义的表示法到这里就介绍完成,接下来是更多转义相关的内容,也是非常有意思的内容,有兴趣的可以继续往下看。

3. raw 字符串

当一个字符串中具有转义的字符时,我们使用 print 打印后,正常情况下,输出的不是我们原来在字符串中看到的那样子。

那如果我们需要输出 hello\nworld ,不希望 Python 将 \n 转义成 换行符呢?

这种情况下,你可以在定义时将字符串定义成 raw 字符串,只要在字符串前面加个 r 或者 R 即可。

>>> print(r"hello\nworld")
hello\nworld
>>> 
>>> print(R"hello\nworld")
hello\nworld

然而,不是所有时候都可以加 r 的,比如当你的字符串是由某个程序/函数返回给你的,而不是你自己生成的

# 假设这个是外来数据,返回 "hello\nworld"
>>> body = spider()
>>> print(body)
hello
world

这个时候打印它,\n 就是换行打印。

4. 使用 repr

对于上面那种无法使用 r 的情况,可以试一下 repr 来解决这个需求:

>>> body = repr(spider())
>>> print(body)
'hello\nworld'

经过 repr 函数的处理后,为让 print 后的结果,接近字符串本身的样子,它实际上做了两件事

  1. \ 变为了 \\
  2. 在字符串的首尾添加 ' 或者 "

你可以在 Python Shell 下敲入 变量 回车,就可以能看出端倪。

首尾是添加 ' 还是 " ,取决于你原字符串。

>>> body="hello\nworld"
>>> repr(body)
"'hello\\nworld'"
>>> 
>>> 
>>> body='hello\nworld'
>>> repr(body)
"'hello\\nworld'"

5. 使用 string_escape

如果你还在使用 Python 2 ,其实还可以使用另一种方法。

那就是使用 string.encode('string_escape') 的方法,它同样可以达到 repr 的效果

>>> "hello\nworld".encode('string_escape')
'hello\\nworld'
>>>

6. 查看原生字符串

综上,想查看原生字符串有两种方法:

  • 如果你在 Python Shell 交互模式下,那么敲击变量回车
  • 如果不在 Python Shell 交互模式下,可先使用 repr 处理一下,再使用 print 打印
>>> body="hello\nworld"
>>> 
>>> body
'hello\nworld'
>>> 
>>> print(repr(body))
'hello\nworld'
>>>

7. 恢复转义:转成原字符串

经过 repr 处理过或者 \\ 取消转义过的字符串,有没有办法再回退出去,变成原先的有转义的字符串呢?

答案是:有。

如果你使用 Python 2,可以这样:

>>> body="hello\\nworld"
>>> 
>>> body
'hello\\nworld'
>>> 
>>> body.decode('string_escape')
'hello\nworld'
>>>

如果你使用 Python 3 ,可以这样:

>>> body="hello\\nworld"
>>> 
>>> body    
'hello\\nworld'
>>> 
>>> bytes(body, "utf-8").decode("unicode_escape")
'hello\nworld'
>>>

什么?还要区分 Python 2 和 Python 3?太麻烦了吧。

明哥教你用一种可以兼容 Python 2 和 Python 3 的写法。

首先是在 Python 2 中的输出

>>> import codecs 
>>> body="hello\\nworld"
>>> 
>>> codecs.decode(body, 'unicode_escape')
u'hello\nworld'
>>>

然后再看看 Python 3 中的输出

>>> import codecs
>>> body="hello\\nworld"
>>> 
>>> codecs.decode(body, 'unicode_escape')
'hello\nworld'
>>>

可以看到 Pyhton 2 中的输出 有一个 u ,而 Python 3 的输出没有了 u,但无论如何 ,他们都取消了转义。

到此这篇关于五种Python转义表示法的文章就介绍到这了,更多相关Python转义内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python共享引用(多个变量引用)示例代码
Dec 04 Python
Python多线程实例教程
Sep 06 Python
Python Web框架Flask中使用百度云存储BCS实例
Feb 08 Python
python2.7 json 转换日期的处理的示例
Mar 07 Python
pandas groupby 分组取每组的前几行记录方法
Apr 20 Python
Django中使用极验Geetest滑动验证码过程解析
Jul 31 Python
pandas实现DataFrame显示最大行列,不省略显示实例
Dec 26 Python
python opencv如何实现图片绘制
Jan 19 Python
python 递归调用返回None的问题及解决方法
Mar 16 Python
解决Django Haystack全文检索为空的问题
May 19 Python
Python HTMLTestRunner库安装过程解析
May 25 Python
pandas抽取行列数据的几种方法
Dec 13 Python
Django如何继承AbstractUser扩展字段
Nov 27 #Python
如何使用 Flask 做一个评论系统
Nov 27 #Python
python+openCV对视频进行截取的实现
Nov 27 #Python
Python环境配置实现pip加速过程解析
Nov 27 #Python
python实现学生信息管理系统(精简版)
Nov 27 #Python
基于Python采集爬取微信公众号历史数据
Nov 27 #Python
Django中日期时间型字段进行年月日时分秒分组统计
Nov 27 #Python
You might like
用文本文件实现的动态实时发布新闻的程序
2006/10/09 PHP
深入php define()函数以及defined()函数的用法详解
2013/06/05 PHP
PHP使Laravel为JSON REST API返回自定义错误的问题
2018/10/16 PHP
javascript getElementsByClassName实现代码
2010/10/11 Javascript
JQuery实现鼠标移动到图片上显示边框效果
2014/01/09 Javascript
Extjs的FileUploadField文件上传出现了两个上传按钮
2014/04/29 Javascript
js单词形式的运算符
2014/05/06 Javascript
JavaScript判断变量是否为数组的方法(Array)
2016/02/24 Javascript
JS组件Bootstrap Table使用实例分享
2016/05/30 Javascript
浅谈DOCTYPE对$(window).height()取值的影响
2016/07/21 Javascript
JS+Canvas绘制动态时钟效果
2017/11/10 Javascript
快速解决vue-cli不能初始化webpack模板的问题
2018/03/20 Javascript
Vue监听滚动实现锚点定位(双向)示例
2019/11/13 Javascript
vue实现匀速轮播效果
2020/06/29 Javascript
three.js如何实现3D动态文字效果
2021/03/03 Javascript
如何处理Python3.4 使用pymssql 乱码问题
2016/01/08 Python
python框架中flask知识点总结
2018/08/17 Python
python机器学习库scikit-learn:SVR的基本应用
2019/06/26 Python
python调用自定义函数的实例操作
2019/06/26 Python
python之生产者消费者模型实现详解
2019/07/27 Python
意大利奢华内衣制造商:Cosabella
2017/08/29 全球购物
捷克家具销售网站:SCONTO Nábytek
2020/01/02 全球购物
中专生学习生活的自我评价分享
2013/10/27 职场文书
参观监狱心得体会
2014/01/02 职场文书
2014年党务公开实施方案
2014/02/27 职场文书
供货协议书范本
2014/04/22 职场文书
经济国贸专业求职信
2014/06/18 职场文书
我的中国梦演讲稿高中篇
2014/08/19 职场文书
教师批评与自我批评
2014/10/15 职场文书
大明湖导游词
2015/02/03 职场文书
2015年乡镇工会工作总结
2015/05/19 职场文书
《你在为谁工作》心得体会(共8篇)
2016/01/20 职场文书
《认识年月日》教学反思
2016/02/19 职场文书
redis实现共同好友的思路详解
2021/05/26 Redis
JavaScript高级程序设计之基本引用类型
2021/11/17 Javascript
python多线程方法详解
2022/01/18 Python