python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python实现Const详解
Jan 27 Python
下载python中Crypto库报错:ModuleNotFoundError: No module named ‘Crypto’的解决
Apr 23 Python
Python 爬取携程所有机票的实例代码
Jun 11 Python
Python使用pyautocad+openpyxl处理cad文件示例
Jul 11 Python
python 多进程并行编程 ProcessPoolExecutor的实现
Oct 11 Python
使用pyinstaller逆向.pyc文件
Dec 20 Python
Python实现桌面翻译工具【新手必学】
Feb 12 Python
django-利用session机制实现唯一登录的例子
Mar 16 Python
python中执行smtplib失败的处理方法
Jul 01 Python
Python爬取网页信息的示例
Sep 24 Python
python如何调用百度识图api
Sep 29 Python
python 解决Windows平台上路径有空格的问题
Nov 10 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
Windows和Linux中php代码调试工具Xdebug的安装与配置详解
2014/05/08 PHP
php使用mysqli向数据库添加数据的方法
2015/03/20 PHP
Yii2框架BootStrap样式的深入理解
2016/11/07 PHP
PHP实现对xml的增删改查操作案例分析
2017/05/19 PHP
PHP实现的迪科斯彻(Dijkstra)最短路径算法实例
2017/09/16 PHP
OAuth认证协议中的HMACSHA1加密算法(实例)
2017/10/25 PHP
jQuery的deferred对象使用详解
2011/08/20 Javascript
javascript/jquery获取地址栏url参数的方法
2014/03/05 Javascript
JavaScript对象数组的排序处理方法
2015/10/21 Javascript
详解JavaScript的变量和数据类型
2015/11/27 Javascript
JavaScript File API文件上传预览
2016/02/02 Javascript
使用BootStrap实现表格隔行变色及hover变色并在需要时出现滚动条
2017/01/04 Javascript
利用PM2部署node.js项目的方法教程
2017/05/10 Javascript
Bootstrap Tooltip显示换行和左对齐的解决方案
2017/10/11 Javascript
实例讲解Vue.js中router传参
2018/04/22 Javascript
举例讲解Python的Tornado框架实现数据可视化的教程
2015/05/02 Python
python实现图片文件批量重命名
2020/03/23 Python
Python迭代器与生成器用法实例分析
2018/07/09 Python
Window环境下Scrapy开发环境搭建
2018/11/18 Python
记录Python脚本的运行日志的方法
2019/06/05 Python
Django框架使用内置方法实现登录功能详解
2019/06/12 Python
python实现简易学生信息管理系统
2020/04/05 Python
Python Selenium参数配置方法解析
2020/01/19 Python
Node.js 和 Python之间该选择哪个?
2020/08/05 Python
一款简洁的纯css3代码实现的动画导航
2014/10/31 HTML / CSS
一款纯css3制作的2015年元旦雪人动画特效教程
2014/12/29 HTML / CSS
HTML5 canvas 基本语法
2009/08/26 HTML / CSS
介绍下java.util.Arrays类
2012/10/16 面试题
成考报名单位证明范本
2014/01/16 职场文书
遗体告别仪式答谢词
2014/01/23 职场文书
大学生两会精神学习心得体会
2014/03/10 职场文书
妇女工作先进事迹
2014/08/17 职场文书
2015欢度元旦标语口号
2014/12/09 职场文书
技能培训通讯稿
2015/07/18 职场文书
高一化学教学反思
2016/02/22 职场文书
2017元旦、春节期间廉洁自律承诺书
2016/03/25 职场文书