一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
使用Python发送邮件附件以定时备份MySQL的教程
Apr 25 Python
Python2.7简单连接与操作MySQL的方法
Apr 27 Python
Python彩色化Linux的命令行终端界面的代码实例分享
Jul 02 Python
python代码 if not x: 和 if x is not None: 和 if not x is None:使用介绍
Sep 21 Python
Python绘制七段数码管实例代码
Dec 20 Python
Python中利用xpath解析HTML的方法
May 14 Python
python图片二值化提高识别率代码实例
Aug 24 Python
Python接口自动化判断元素原理解析
Feb 24 Python
python统计函数库scipy.stats的用法解析
Feb 25 Python
python实现扫雷小游戏
Apr 24 Python
Python下划线5种含义代码实例解析
Jul 10 Python
Python实现对齐打印 format函数的用法
Apr 28 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
「OVERLORD」动画重要删减!雅儿贝德的背叛?至尊猎杀队结成
2020/04/09 日漫
PHP5 的对象赋值机制介绍
2011/08/02 PHP
开启PHP Static 关键字之旅模式
2015/11/13 PHP
PHP用PDO如何封装简单易用的DB类详解
2017/07/30 PHP
个人总结的一些关于String、Function、Array的属性和用法
2007/01/10 Javascript
Firefox div高度自适应
2009/04/28 Javascript
File, FileReader 和 Ajax 文件上传实例分析(php)
2011/04/27 Javascript
javascript 实现 秒杀,团购 倒计时展示的记录 分享
2013/07/12 Javascript
javaScript函数中执行C#代码中的函数方法总结
2013/08/07 Javascript
jquery结合CSS使用validate实现漂亮的验证
2015/01/29 Javascript
基于element-ui的rules中正则表达式
2018/09/04 Javascript
微信小程序实现文字跑马灯
2020/05/26 Javascript
vue 解决遍历对象显示的顺序不对问题
2019/11/07 Javascript
js实现简单贪吃蛇游戏
2020/05/15 Javascript
简单了解JavaScript arguement原理及作用
2020/05/28 Javascript
[03:40]DOTA2英雄梦之声_第01期_炼金术士
2014/06/23 DOTA
[47:26]完美世界DOTA2联赛 LBZS vs Forest 第二场 11.07
2020/11/09 DOTA
python 布尔操作实现代码
2013/03/23 Python
Python之re操作方法(详解)
2017/06/14 Python
浅谈python jieba分词模块的基本用法
2017/11/09 Python
Python引用计数操作示例
2018/08/23 Python
Python sklearn KFold 生成交叉验证数据集的方法
2018/12/11 Python
详解python中sort排序使用
2019/03/23 Python
linux mint中搜狗输入法导致pycharm卡死的问题
2020/10/28 Python
购买200个世界上最好的内衣品牌:Bare Necessities
2017/02/11 全球购物
Hotels.com加拿大:领先的在线住宿网站
2018/10/05 全球购物
Notino匈牙利:购买香水和化妆品
2019/04/12 全球购物
艺术应用与设计专业个人的自我评价
2013/11/19 职场文书
校园文化标语
2014/06/18 职场文书
房产公证委托书范本
2014/09/20 职场文书
继承权公证书范本
2015/01/23 职场文书
2015年办公室文员工作总结
2015/04/24 职场文书
HTML通过表单实现酒店筛选功能
2021/05/18 HTML / CSS
MySQL 8.0 之不可见列的基本操作
2021/05/20 MySQL
微信小程序scroll-view不能左右滑动问题的解决方法
2021/07/09 Javascript
css实现左上角飘带效果的完整代码
2022/03/18 HTML / CSS