python正则过滤字母、中文、数字及特殊字符方法详解


Posted in Python onFebruary 11, 2020

去除数字,特殊字符,只保留汉字

import re
 
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:中国

去除特殊字符,只保留汉子,字母、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数 说明
sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**] 表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围
\uAC00-\uD7AF 韩文的unicode范围
\u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

Python 相关文章推荐
python使用PyFetion来发送短信的例子
Apr 22 Python
python魔法方法-自定义序列详解
Jul 21 Python
Python 提取dict转换为xml/json/table并输出的实现代码
Aug 28 Python
python实现邮件发送功能
Aug 10 Python
python中树与树的表示知识点总结
Sep 14 Python
Python pip 安装与使用(安装、更新、删除)
Oct 06 Python
python实现名片管理器的示例代码
Dec 17 Python
pytorch 实现将自己的图片数据处理成可以训练的图片类型
Jan 08 Python
python实现百度OCR图片识别过程解析
Jan 17 Python
scrapy-redis分布式爬虫的搭建过程(理论篇)
Sep 29 Python
利用python进行数据加载
Jun 20 Python
Python 操作pdf pdfplumber读取PDF写入Exce
Aug 14 Python
python3正则模块re的使用方法详解
Feb 11 #Python
Python版中国省市经纬度
Feb 11 #Python
Python终端输出彩色字符方法详解
Feb 11 #Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
Feb 11 #Python
利用python中集合的唯一性实现去重
Feb 11 #Python
TensorFLow 变量命名空间实例
Feb 11 #Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 #Python
You might like
探讨:如何使用PhpDocumentor生成文档
2013/06/25 PHP
php引用传值实例详解学习
2013/11/06 PHP
Laravel框架实现利用监听器进行sql语句记录功能
2018/06/06 PHP
javascript下function声明一些小结
2007/12/28 Javascript
Javascript 面向对象编程(一) 封装
2011/08/28 Javascript
offsetHeight在OnLoad中获取为0的现象
2013/07/22 Javascript
JS.GetAllChild(element,deep,condition)使用介绍
2013/09/21 Javascript
实现checkbox全选、反选、取消JavaScript小脚本异常
2014/04/10 Javascript
javascript中解析四则运算表达式的算法和示例
2014/08/11 Javascript
jquery实现无限分级横向导航菜单的方法
2015/03/12 Javascript
javascript动态创建表格及添加数据实例详解
2015/05/13 Javascript
详解JavaScript中|单竖杠运算符的使用方法
2016/05/23 Javascript
微信小程序-拍照或选择图片并上传文件
2017/01/06 Javascript
JavaScript实现弹出广告功能
2017/03/30 Javascript
vue项目前端错误收集之sentry教程详解
2019/05/27 Javascript
JavaScript交换两个变量方法实例
2019/11/25 Javascript
jquery实现进度条状态展示
2020/03/26 jQuery
Vue使用Ref跨层级获取组件的步骤
2021/01/25 Vue.js
[03:01]DOTA2英雄基础教程 露娜
2014/01/07 DOTA
[03:24][TI9纪实] Dota奶爸
2019/08/22 DOTA
解决python使用open打开文件中文乱码的问题
2017/12/29 Python
Pandas之drop_duplicates:去除重复项方法
2018/04/18 Python
利用Python进行数据可视化常见的9种方法!超实用!
2018/07/11 Python
对python PLT中的image和skimage处理图片方法详解
2019/01/10 Python
Anaconda之conda常用命令介绍(安装、更新、删除)
2019/10/06 Python
pytorch中的自定义数据处理详解
2020/01/06 Python
Python数据可视化处理库PyEcharts柱状图,饼图,线性图,词云图常用实例详解
2020/02/10 Python
Numpy中的数组搜索中np.where方法详细介绍
2021/01/08 Python
海蓝之谜(LA MER)澳大利亚官方商城:全球高端奢华护肤品牌
2017/10/27 全球购物
英国的屈臣氏:Boots博姿
2017/12/23 全球购物
一名女生的自荐信
2013/12/08 职场文书
北京申奥口号
2014/06/19 职场文书
基层党员学习党的群众路线教育实践活动心得体会
2014/11/04 职场文书
新年寄语2016
2015/08/17 职场文书
月考总结与反思
2015/10/22 职场文书
react国际化react-intl的使用
2021/05/06 Javascript