Python匹配中文的正则表达式


Posted in Python onMay 11, 2016

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。

Python正则表达式简介

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。

以上说的都是给正文做铺垫的,下面看下python正则表达式如何匹配中文的。

# -*- coding: utf-8 -*-
import re
def findPart(regex, text, name):
res=re.findall(regex, text)
if res:
print "There are %d %s parts:\n"% (len(res), name)
for r in res:
print "\t",r.encode("utf8")
print
text ="#who#helloworld#a中文x#"
usample=unicode(text,'utf8')
findPart(u"#[\w\u2E80-\u9FFF]+#", usample, "unicode chinese")

注:

几个主要非英文语系字符范围

2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。

3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。

4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。

A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。

AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。

F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。

FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角

(
#!/usr/bin/python3
# -*- coding: UTF-8 -*-
import re
message = u'天人合一'.encode('utf8')
print(re.search(u'人'.encode('utf8'), message).group())
交互模式下的例子
>>> import re
>>> s='Phone No. 010-87654321'
>>> 
>>> r=re.compile(r'(\d+)-(\d+)')
>>> m=r.search(s)
>>> m
<_sre.SRE_Match object at 0x010EE218>
)

以上所述是小编给大家介绍的Python正则表达式匹配中文的方法,希望对大家有所帮助!

Python 相关文章推荐
Python中return语句用法实例分析
Aug 04 Python
Python实现判断一行代码是否为注释的方法
May 23 Python
python实现一个简单的udp通信的示例代码
Feb 01 Python
VSCode Python开发环境配置的详细步骤
Feb 22 Python
Django学习笔记之为Model添加Action
Apr 30 Python
Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例
Jun 04 Python
使用Windows批处理和WMI设置Python的环境变量方法
Aug 14 Python
pytorch 更改预训练模型网络结构的方法
Aug 19 Python
python 两个数据库postgresql对比
Oct 21 Python
python 穷举指定长度的密码例子
Apr 02 Python
Mac PyCharm中的.gitignore 安装设置教程
Apr 16 Python
使用Python matplotlib作图时,设置横纵坐标轴数值以百分比(%)显示
May 16 Python
Python3使用requests发闪存的方法
May 11 #Python
Python3控制路由器——使用requests重启极路由.py
May 11 #Python
Python3使用requests登录人人影视网站的方法
May 11 #Python
在Django中进行用户注册和邮箱验证的方法
May 09 #Python
Python数据类型详解(三)元祖:tuple
May 08 #Python
Python数据类型详解(二)列表
May 08 #Python
Python数据类型详解(一)字符串
May 08 #Python
You might like
php中3种方法删除字符串中间的空格
2014/03/10 PHP
在JavaScript中,为什么要尽可能使用局部变量?
2009/04/06 Javascript
Prototype Template对象 学习
2009/07/19 Javascript
Js如何判断客户端是PC还是手持设备简单分析
2012/11/22 Javascript
javascript数组去重3种方法的性能测试与比较
2013/03/26 Javascript
jQuery拖动图片删除示例
2013/05/10 Javascript
JS检测图片大小的实例
2013/08/21 Javascript
JavaScript Math.ceil() 函数使用介绍
2013/12/11 Javascript
js 弹出新页面避免被浏览器、ad拦截的一种新方法
2014/04/30 Javascript
Javascript学习笔记之相等符号与严格相等符号
2014/11/23 Javascript
js提交form表单,并传递参数的实现方法
2016/05/25 Javascript
js生成随机数方法和实例
2017/01/17 Javascript
用javascript实现倒计时效果
2021/02/09 Javascript
[08:40]Navi Vs Newbee
2018/06/07 DOTA
测试、预发布后用python检测网页是否有日常链接
2014/06/03 Python
Python常用时间操作总结【取得当前时间、时间函数、应用等】
2017/05/11 Python
对python list 遍历删除的正确方法详解
2018/06/29 Python
python实现一组典型数据格式转换
2018/12/15 Python
python使用pandas处理excel文件转为csv文件的方法示例
2019/07/18 Python
Python中输入和输出(打印)数据实例方法
2019/10/13 Python
Pytorch之view及view_as使用详解
2019/12/31 Python
使用keras2.0 将Merge层改为函数式
2020/05/23 Python
Python实现迪杰斯特拉算法过程解析
2020/09/18 Python
python 窃取摄像头照片的实现示例
2021/01/08 Python
Ray-Ban雷朋美国官网:全球领先的太阳眼镜品牌
2016/07/20 全球购物
美国知名平价彩妆品牌:e.l.f. Cosmetics
2017/11/20 全球购物
俄罗斯电子产品、计算机和家用电器购物网站:OLDI
2019/10/27 全球购物
JDO的含义
2012/11/17 面试题
LINUX下线程,GDI类的解释
2012/04/17 面试题
生物技术专业研究生自荐信
2013/09/22 职场文书
关于毕业的广播稿
2014/01/10 职场文书
毕业评语大全
2014/05/04 职场文书
弄虚作假心得体会
2014/09/10 职场文书
给老婆的保证书
2015/01/16 职场文书
教师节主题班会教案
2015/08/17 职场文书
Spring Boot项目传参校验的最佳实践指南
2022/04/05 Java/Android