python正则过滤字母、中文、数字及特殊字符方法详解


Posted in Python onFebruary 11, 2020

去除数字,特殊字符,只保留汉字

import re
 
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:中国

去除特殊字符,只保留汉子,字母、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数 说明
sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**] 表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围
\uAC00-\uD7AF 韩文的unicode范围
\u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

Python 相关文章推荐
Python中的自定义函数学习笔记
Sep 23 Python
python执行外部程序的常用方法小结
Mar 21 Python
Python实现统计英文单词个数及字符串分割代码
May 28 Python
通过数据库对Django进行删除字段和删除模型的操作
Jul 21 Python
TF-IDF与余弦相似性的应用(二) 找出相似文章
Dec 21 Python
DataFrame 将某列数据转为数组的方法
Apr 13 Python
PyQt5每天必学之单行文本框
Apr 19 Python
python3中利用filter函数输出小于某个数的所有回文数实例
Nov 24 Python
Django通用类视图实现忘记密码重置密码功能示例
Dec 17 Python
pytorch实现mnist数据集的图像可视化及保存
Jan 14 Python
Python类成员继承重写的实现
Sep 16 Python
python ansible自动化运维工具执行流程
Jun 24 Python
python3正则模块re的使用方法详解
Feb 11 #Python
Python版中国省市经纬度
Feb 11 #Python
Python终端输出彩色字符方法详解
Feb 11 #Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
Feb 11 #Python
利用python中集合的唯一性实现去重
Feb 11 #Python
TensorFLow 变量命名空间实例
Feb 11 #Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 #Python
You might like
php URL验证正则表达式
2011/07/19 PHP
PHP在获取指定目录下的目录,在获取的目录下面再创建文件,多平台
2011/08/03 PHP
thinkphp5使用无限极分类
2019/02/18 PHP
js和jquery对dom节点的操作(创建/追加)
2013/04/21 Javascript
IE下Ajax缓存问题的快速解决方法(get方式)
2014/01/09 Javascript
JavaScript中的Promise使用详解
2015/06/24 Javascript
一步一步封装自己的HtmlHelper组件BootstrapHelper(三)
2016/09/14 Javascript
Node.js websocket使用socket.io库实现实时聊天室
2017/02/20 Javascript
Node.JS利用PhantomJs抓取网页入门教程
2017/05/19 Javascript
vue的常用组件操作方法应用分析
2018/04/13 Javascript
在Vuex使用dispatch和commit来调用mutations的区别详解
2018/09/18 Javascript
js实现一个页面多个倒计时的3种方法
2019/02/25 Javascript
layui原生表单验证的实例
2019/09/09 Javascript
js实现的在本地预览图片功能示例
2019/11/09 Javascript
Vue中点击active并第一个默认选中功能的实现
2020/02/24 Javascript
Vue+axios封装请求实现前后端分离
2020/10/23 Javascript
Python下singleton模式的实现方法
2014/07/16 Python
基于Python3 逗号代码 和 字符图网格(详谈)
2017/06/22 Python
DataFrame 将某列数据转为数组的方法
2018/04/13 Python
Python列表解析操作实例总结
2020/02/26 Python
详解Pycharm出现out of memory的终极解决方法
2020/03/03 Python
Python批量将图片灰度化的实现代码
2020/04/11 Python
python函数中将变量名转换成字符串实例
2020/05/11 Python
python合并多个excel文件的示例
2020/09/23 Python
纽约香氛品牌:NEST Fragrance
2018/10/15 全球购物
Kathmandu新西兰官网:新西兰户外运动品牌
2019/07/27 全球购物
索引覆盖(Index Covering)查询含义
2012/02/18 面试题
网站编辑求职信
2013/10/17 职场文书
CAD制图人员的自荐信
2014/02/07 职场文书
应届毕业生自荐书
2014/06/18 职场文书
无财产无子女离婚协议书范文
2014/09/14 职场文书
党校个人总结
2015/03/04 职场文书
经典爱情感言
2015/08/03 职场文书
Mysql中调试存储过程最简单的方法
2021/06/30 MySQL
SqlServer数据库远程连接案例教程
2021/07/15 SQL Server
redis数据一致性的实现示例
2022/03/18 Redis